L’analyse comparative du transcriptome du canard domestique indien révèle des gènes candidats impliqués dans la production d’œufs

Propriétés phénotypiques

Le poids corporel et le poids des œufs ne différaient pas significativement entre les canards HEL et LEL (Figure 1b, c). Cependant, la différence dans le nombre total d’œufs pondus par les canards HEL et LEL était significative (Figure 1d). Les canes HEL ont pondu en moyenne 212 œufs de plus que les canes LEL en 93 semaines.

Caractéristiques transcriptionnelles des ovaires de cane

Onze transcrits ovariens ont été séquencés pour analyser les changements transcriptomiques ovariens chez les canards HEL et LEL et pour identifier les gènes impliqués dans la production d’œufs. Au total, 806 967 717 millions de lectures brutes ont été générées, soit une moyenne de 73 360 701 millions de lectures par échantillon. Après filtration de l’ARN ribosomique, des adaptateurs et des lectures de faible qualité, le nombre de lectures pures variait de 50 718 335 à 118 504 555 (tableau 1). Les rapports de cartographie STAR ont montré que 71,4 à 84,3 % des lectures étaient cartographiées sur le génome du canard de référence. Le degré de cartographie était comparable aux études de transcriptome précédentes12.13. En moyenne, 80,5% des lectures ont été cartographiées avec des gènes annotés du génome. L’analyse en composantes principales (ACP) a été réalisée à l’aide de données d’expression normalisées pour comprendre le regroupement et la variabilité des transcripomes de canard HEL et LEL. Les principaux composants 1 et 2 représentaient respectivement 53 % et 16 % de la variation de l’expression génique (figure 2a). Le composant majeur 3 expliquait 7% supplémentaires de la variation de l’expression génique (Figure 2b). Nous avons détecté l’expression (> 0 lectures dans au moins un échantillon) dans 14 144 gènes (tableau supplémentaire 1).

Tableau 1 Caractéristiques des données de transcription ovarienne pour les œufs de ponte haute et basse.
Figure 2
Figure 2

Analyse des principaux composants montrant une variation génétique dans les lots HEL et LEL sur la base des données de transcription. (un) PC 1 contre PC 2 et (b) PC3 contre PC4.

Identification des DEG

Un total de 489 gènes se sont avérés exprimés de manière significativement différente (FC> 1,5, FDR <0,1 & P <0,005) entre les tissus ovariens HEL et LEL (tableau 2 supplémentaire). Parmi ceux-ci, 310 et 179 gènes étaient régulés à la hausse et à la baisse chez les canards HEL, respectivement (figure 3a). Y compris les gènes HEL régulés positivement FAM19A4, LHX9, GRIK3, LRFN2, GUCA1B, SLC26A9 et gènes régulés positivement dans LEL (régulés négativement dans HEL) P2RX6, TNNT2, ISG15et LY96 . Parmi les principaux gènes régulés à la hausse, il y avait trois gènes non caractérisés (ENSAPLG00000001875, ENSAPLG00000002685et ENSAPLG00000002064 ) et les quatre meilleurs gènes non régulés étaient parmi les plus grands gènes non régulés (ENSAPLG00000004628, ENSAPLG00000006301, ENSAPLG00000000489et ENSAPLG00000004923 ). Le regroupement hiérarchique des DEG a montré que les échantillons regroupés par groupe (HEL et LEL) et DEG étaient regroupés en deux grands groupes (figure 3b). De plus, les fonctions putatives des DEG ont été analysées par blast à partir des bases de données GenBank et UniProt, et 38 gènes se sont avérés impliqués dans le développement des ovocytes, la folliculogenèse et les fonctions de reproduction (tableau 2). Ceux-ci comprenaient GRIK3, GRIA1, SYCP2L, KPNA7 et DHP, qui a été enrichi par HEL et P2RX6, CCL5, LY96, CCL3 et WIF1 enrichi en LEL (réglementé à la baisse en HEL).

figure 3
figure 3

Expression génique différentielle entre les canards HEL et LEL. (un) Le graphique volcanique montre les DEG entre les canards HEL et LEL. Chaque point représente un gène. Les points rouges et bleus indiquent les DEG régulés à la hausse et à la baisse, respectivement, et les points gris indiquent les gènes non différenciés. (b) Carte thermique montrant différentes expressions géniques des canards HEL et LEL. “Rouge” indique un faible niveau d’expression relative et “vert” indique un niveau d’expression relative élevé. Chaque colonne et ligne représente respectivement un échantillon et un gène.

Tableau 2 Liste des gènes différentiellement exprimés impliqués dans la production d’œufs.

DEG contrôle qPCR

La qRT-PCR a été réalisée avec sept DEG sélectionnés au hasard, par ex. LRFN2, RIN2, FAM19A4, PERP, CCL5, OVCH1et LY96 . Les résultats de la qPCR pour ces gènes étaient cohérents avec les résultats de l’ARN-Seq, ce qui suggère que les résultats de l’ARN-Seq sont fiables.

Classification GO et annotation fonctionnelle des DEG

Pour déterminer les fonctions biologiques des DEG, nous avons effectué une analyse de performance avec l’anthologie des gènes et InterProbases de données. Les gènes ont été enrichis pour 19 catégories d’ontologies de gènes (FDR ≤ 0,1 ; ​​Figure 4 ; Tableau 3 supplémentaire). Parmi elles, sept catégories ont été enrichies pour les fonctions cellulaires et 12 catégories pour les fonctions moléculaires. Les activités sérine hydrolase, endopeptidase de type sérine et peptidase de type sérine faisaient partie des termes de fonctions moléculaires hautement enrichies. Ces catégories comprenaient 24 gènes, dont ceux de la famille des cathepsines (CTSC: log2FC = 1,41, FDR = 0,010 ; CTSL : log2FC = 1,34, FDR = 0,017 et CSP :log2FC = 0,83, FDR = 0,032), facteurs de coagulation (F3: log2FC = – 0,59, FDR = 0,097 ; F10: log2FC = – 0,625, FDR = 0,07), ovohymase (OVCH1: log2FC = 1,34, FDR = 0,099 et OVCH2: log2FC = 1,15, FDR = 0,087) et des peptidases telles que la métallopeptidase matricielle 13 (MMP13: log2FC = -2,84, FDR = 0,067) et sérine peptidase HTRA (HTRA1 : log2FC = – 0,735, FDR = 0,071). Une autre catégorie enrichie importante était celle des fonctions des canaux ioniques (par exemple, l’activité des canaux sodiques, 8 gènes, page = 9.53E-5, FDR = 5.58E-2) et l’activité de canal ionique extracellulaire associée au glutamate (6 gènes, page = 8,99E – 5, FDR = 6,15E – 2). Ces catégories comprenaient GRIA1 (log2FC = 1,895, FDR = 0,049) et GRIK3(log2FC = 2,06, FDR = 0,013).

Figure 4
Figure 4

Analyse d’enrichissement GO montrant les termes significativement enrichis en DEG détectés entre les canards HEL et LEL.

Aucun des domaines de processus biologiques de la catégorie GO n’a été statistiquement enrichi après correction pour les tests d’hypothèses multiples (tableau supplémentaire 3). Cependant, ces catégories de processus biologiques légèrement enrichis mettent en évidence des gènes liés au système immunitaire (par exemple, l’entrée du virus dans les cellules hôtes (page= 9,5E – 5, FDR = 0,338), morphogenèse gonadique (page= 7,05E – 4 et FDR = 0,476), métabolisme du glutamate (page = 2.15E – 04, FDR = 3.04E – 01), régulation négative de la réplication du génome viral (page= 3,69E – 04, FDR = 4,76E – 01)) et la régulation du niveau hormonal (page= 4,67E – 4 et FDR = 4,14E1). Un seul gène, LIM homeobox 9 (LHX9)était associée à la morphogenèse gonadique, l’un des gènes les plus fortement exprimés différentiellement (log2FC = 2,07 FDR = 3,01E-05). MX1le gène était l’un des neuf gènes impliqués dans l’entrée virale dans les cellules hôtes et est également exprimé de manière différentielle (log2FC = -1,08, FDR = 0,008). Les gènes impliqués dans l’entrée virale dans les cellules hôtes et d’autres modèles liés au système immunitaire ont tendance à être régulés positivement chez les canards LEL (5/9 du gène est enrichi en entrée virale dans la cellule hôte par le terme GO). De plus, la classification fonctionnelle des DEG par domaine de famille de protéines basée sur la base de données InterPro a montré que 17 DEG étaient enrichis sous le sous-type d’immunoglobuline. En plus de ceux-ci, plusieurs autres gènes, y compris FAM19Arécepteur dopaminergique D2 (DRD2), Interacteur Ras et Rab 2 (RIN2), LHX9Ceux impliqués dans le processus de développement reproducteur, tels que la maturation des ovocytes, la folliculogenèse et la morphogenèse gonadique, ont également été exprimés de manière différentielle (figure 4; tableau supplémentaire 3).

Enrichissement de la piste KEGG

Le test d’enrichissement de la voie KEGG a été effectué pour obtenir une classification fonctionnelle supplémentaire et la détermination de la voie des DEG. Plusieurs voies ont montré un enrichissement (Figure 5 ; Tableau 4 supplémentaire), y compris la voie de signalisation Rap1 (hsa04015, adaptée page= 0,034, 11 gènes), synapse glutamatergique (hsa04724, adapté page= 0,0016, 10 gènes, voie de signalisation de l’AMPc (hsa04024, adapté page= 0,093, 10 gènes, voie de signalisation MAPK (hsa04010, adapté page= 0,037,9 gènes), développement d’ovocytes médié par la progestérone (hsa04914, adapté page= 0,044, 7 gènes) et absorption quotidienne (hsa04713, adapté page= 0,010, 6 gènes).

Figure 5
Figure 5

Thés KEGG enrichis en DEG. L’axe des x représente le GeneRatio des gènes enrichis et l’axe des y montre les noms des voies enrichies. La zone de chaque point indique le nombre de gènes enrichis et la couleur indique la signification de la valeur FDR (le rouge indique une signification élevée et le bleu indique une faible signification).

Réseau d’interaction protéine – protéine

L’analyse du réseau d’interaction DEG-protéine a montré que 32 gènes ont une forte interaction (score d’interaction minimum 0, 9). Les gènes impliqués dans la voie de signalisation MAPK, l’absorption circadienne, la maturation des ovocytes médiée par la progestérone, les voies de signalisation de la synapse glutamatergique et de l’ocytocine formaient un seul groupe, et les gènes qui faisaient partie de la voie des peroxysomes formaient un groupe distinct (Figure 6).

Figure 6
Figure 6

Réseau d’interaction protéine-protéine des DEG. La couleur des nœuds indique la voie à laquelle appartiennent les gènes. Les arêtes montrent des interactions à haute fiabilité (0,9).

Leave a Comment