• 美文
  • 文章
  • 散文
  • 日记
  • 诗歌
  • 小说
  • 故事
  • 句子
  • 作文
  • 签名
  • 祝福语
  • 情书
  • 范文
  • 读后感
  • 文学百科
  • 当前位置: 柠檬阅读网 > 范文 > 正文

    生菜bHLH转录因子家族的鉴定与生物信息学分析

    时间:2023-03-24 11:15:07 来源:柠檬阅读网 本文已影响 柠檬阅读网手机站

    隋心意,赵小刚,毛 欣,李亚灵,温祥珍

    (山西农业大学园艺学院,山西太谷 030801)

    bHLH转录因子是广泛存在于动物、植物中的转录因子超家族,因其含有‘螺旋-环-螺旋’结构域而得名[1]。bHLH结构域由50~60个氨基酸组成,包括N端的碱性区(Basic region)和C端HLH区(Helix Loop Helix)[2]。其中N端的碱性区域由10~15个氨基酸组成,植物中50%以上的碱性氨基酸区含有高度保守的H5-E9-R13(His5-Glu9-Arg13)序列,该序列通过和特定DNA的顺式作用元件结合激发基因转录;
    HLH区域主要由40个左右的疏水性氨基酸组成,有利于HLH区域二聚体的形成和蛋白质二级结构的稳定[3-4]。依据进化关系、基因功能、与DNA的结合模式,动物中bHLH转录因子被分为 6个组(A、B、C、D、E、F),45个家族[5]。与动物相比,植物的bHLH蛋白较少,大多数植物bHLH蛋白在动物家族分类中属于B组[6]。目前在拟南芥中鉴定出了162个bHLH家族转录因子,与水稻中的bHLH转录因子一起被分成了25个亚家族[7-9];
    将水稻中的165个转录因子分为22个亚家族[9],将拟南芥中161个转录因子分为21个亚家族[10];
    PIRES等[11]利用对来源于藻类和陆生植物的500多个bHLH蛋白的分析,将植物bHLH蛋白分为26个亚家族。随着全基因组测序技术的发展,越来越多物种中的bHLH转录因子正在被鉴定出来。

    在拟南芥中的大量研究表明,bHLH转录因子参与了形态建成、生长发育、抗逆反应、信号转导和次生代谢等多种生物学过程[2,12],比如PIF4参与调控拟南芥下胚轴的伸长过程[13],GL3和EGL3基因控制根表皮的细胞分化[14],EMBRYO1基因控制胚胎发育[15],DYTl控制绒毡层的分化和发育[16],SPATULA基因控制雌蕊的发育[17];
    同时有研究表明AtbHLH112对抗盐、抗旱和抗渗透胁迫有正调控作用,但抑制根系发育[18-19],OsHLH013和OsHLH016调控花青素的生物合成,PIF3和PIF4在光敏色素信号传导中起调控作用[13,20]。在水稻的大量研究中表明bHLH转录因子在气孔发育、腋芽原基形成、胚乳发育、种皮颜色、铁元素吸收利用、耐盐性和抗旱性方便也发挥着非常重要的作用。

    生菜(Lactuca sativa L.)又名叶用莴苣,为菊科菊苣属一年生草本植物,富含维生素C、维生素E、叶酸、多酚、膳食纤维、生育酚和类胡萝卜素等营养物质,是日常生活不可或缺的蔬菜之一[21]。随着生菜全基因组数据的公布,有必要对生菜bHLH家族基因进行全基因组挖掘和全面、系统分析。因此本研究计划使用生物信息学的方法,从基因组水平上对生菜bHLH家族的蛋白特性、保守域结构、内含子与外显子数量、motif分布和功能分化等方面进行研究,以期为生菜bHLH家族基因的克隆、功能解析提供理论基础。

    1.1 数据来源

    从NCBI(https://www.ncbi.nlm.nih.gov/)数据库中下载生菜基因组数据和蛋白组数据,通过Pfam(http://pfam.xfam.org/)数据库中下载bHLH结构域的隐马氏模型(登录号为:PF00010)。利用HMMER3.0软件,以隐马氏模型文件PF00010对生菜蛋白组数据进行搜索,获得生菜中含有bHLH结构域的候选蛋白家族成员的蛋白序列。用SMART(http://smart.emblheidelberg.de/)数据库比对得到的蛋白序列,将无bHLH结构域的序列剔除,确定最终候选基因。

    1.2 生菜bHLH蛋白的特性分析

    通过ExPASy ProtParam tool(https://web.expasy.org/protparam/)预测bHLH蛋白氨基酸序列的基本信息,包括氨基酸数量、相对分子量、等电点、疏水性和不稳定性等理化性质。通过在线软件Cell Ploc 2.0进行亚细胞定位预测(http://www.csbio.sjtu.edu.cn/bioinf/Cell-PLoc/);
    通过在线软件THHMM 2.0(http://www.cbs.dtu.dk/services/TMHMM/)进行跨膜结构分布和数量的预测。

    1.3 生菜bHLH蛋白的保守域序列分析

    利用序列分析软件DNAMAN 5.0和在线软件WebLogo(http://weblogo.berkeley.edu/logo.cgi)对生菜bHLH蛋白的保守结构域分析。

    1.4 生菜bHLH基因基序预测分析

    将生菜bHLH家族的蛋白序列提交到在线网站MEME 4.11.4(http://web.mit.edu/meme_v4.11.4/share/doc/overview.html)进行motif预测分析,搜索基序设置为10,基序长度介于6~50之间,导出meme.xml结果文件。将生菜bHLH基因家族每个成员的CDS序列和其对应的基因组序列进行比对,利用GSDS(http://gsds.cbi.pku.edu.cn/)在线软件进行内含子和外显子图谱的绘制。

    1.5 生菜bHLH基因的进化分析

    将最终获得的135个生菜bHLH转录因子用ClustalX进行比对,序列比对的结果用MEGA 7.0的NJ法(Neighbor Joining)构建系统发育树,其中检验参数为Bootrap 1000次,模式设置为Poisson model,缺口设置为pair gap deletion。将制作好的进化树导出,利用ITOL网站进行美化和丰富颜色(https://itol.embl.de/)。

    2.1 生菜bHLH基因家族成员鉴定

    从Pfam数据库中下载bHLH家族的隐马氏模型文件(Pfam码PF00010),搜索生菜的全基因组蛋白数据库,共得到163条bHLH类似基因;
    用SMART数据库和hammer网站结构域分析工具鉴定得到的蛋白序列,检查序列缺失、去除冗余,最终获得135条bHLH序列。利用expasy在线程序对生菜bHLH蛋白的理化性质进行分析,bHLH蛋白特性分析表明,最长的bHLH蛋白有685个蛋白质残基,而最短的只有162个蛋白质残基;
    它们的等电点分布在0.63~9.51之间,其中有92个酸性蛋白,43个碱性蛋白;
    相对分子量在17843.82~75409.15 Da之间;
    不稳定指数分布在32.5~76.39之间,其中有123个蛋白的不稳定系数大于40,说明大部分bHLH蛋白为不稳定蛋白;
    135个蛋白的疏水性指数均小于0,为亲水性蛋白。cell plot的预测表明有100个蛋白属于细胞核蛋白,是生菜bHLH家族中数目最多的一部分,有16个蛋白定位于叶绿体,有3个蛋白定位于细胞质,有1个蛋白定位于内质网,有1个蛋白定位于细胞膜;
    有1个蛋白定位于线粒体。跨膜结构域分析表明,有134个蛋白无跨膜结构域,有1个蛋白有1个跨膜结构域。但目前这些转录因子还未被定位于染色体上。

    2.2 生菜bHLH基因保守域的鉴定和分析

    使用DNAMAN 5.0对135个生菜bHLH蛋白结构域进行鉴定和分析,并用WebLogo 3获得生菜bHLH蛋白的结构域序列标签。分析发现135个生菜bHLH基因保守域基本由50个氨基酸组成,最长为53个氨基酸,最短为43个氨基酸;
    该保守域由N端碱性结构域和C端HLH结构域组成;
    其中N端碱性结构域由10~15个氨基酸组成,该区域富含碱性氨基酸精氨酸(R)、赖氨酸(K)、组氨酸(H)和酸性氨基酸谷氨酸(E),谷氨酸可以和DNA的大沟结合。DNAMAN分析表明有103条bHLH序列同时在9位点和12位点同时为E和R,该序列组成可以结合E-Box,有59条bHLH序列同时在5位点、9位点和13位点同时为H、E和R,主要有结合G-Box的功能。C端的HLH结构域的α螺旋富含疏水性氨基酸缬氨酸(V)、亮氨酸(L)、异亮氨酸(I)、脯氨酸(P)、丙氨酸(A),其中第23位点的L高度保守,这对维持bHLH蛋白二级结构的稳定有重要作用(图1、图2)。

    图1 生菜bHLH结构域的氨基酸序列比对

    图2 生菜bHLH转录因子家族的保守结构域

    2.3 生菜bHLH转录因子家族进化分析

    为了研究生菜bHLH家族成员间的进化关系,利用MEGA7.0对135个蛋白的序列进行进化树分析,结果表明135个bHLH基因被分为10个亚家族(图3),其中第Ⅷ、Ⅳ和Ⅶ亚家族的bHLH蛋白成员最多,分别包含43、27和15个bHLH蛋白;
    第Ⅰ、Ⅲ、Ⅵ、Ⅸ、Ⅱ、Ⅹ亚家族的bHLH蛋白成员为5~10个;
    而第Ⅴ亚家族的成员最少,只含有1个bHLH蛋白。

    图3 生菜中bHLH蛋白家族的系统进化树

    2.4 生菜bHLH蛋白的保守基序确定

    为了进一步研究生菜中bHLH蛋白质结构的多样性,通过MEME在线软件对135个bHLH蛋白质进行了保守基序分析,搜索参数设置为50,共获得10条保守基序。由图4可知,135个bHLH蛋白含有2~4个基序,相同家族的bHLH蛋白倾向于有相同的基序,不同的家族间bHLH蛋白基序数量和类型存在差异,推测正是由于这些特异motif的存在导致了bHLH家族基因功能的分化。但不同的家族均包含基础基序motif 1和motif 2,在Inter Pro Scan中这两个基序被注释为Helix-loop-helix DNA-binding domain。在同一家族间内根据motif的差异和基因长度的不同划分为不同的亚家族,一些基序仅存在于特定基因中,这些基序可能有助于形成这些基因的特定功能。其中motif 3特异分布于Ⅷ亚家族,该基序被注释为Basic helix-loophelix leucine zipper transcription factor;
    motif 4分布于Ⅱ、Ⅲ、Ⅳ、Ⅵ、Ⅶ和Ⅹ六个亚家族;
    motif 5特异分布于Ⅱ亚家族;
    motif 6特异分布于Ⅷ亚家族;
    motif 7分布于Ⅶ和Ⅷ两个亚家族;
    motif 8特异分布于Ⅷ亚家族;
    motif 9特异分布于Ⅳ亚家族;
    motif 10特异分布于Ⅹ亚家族,motif 4-10在Inter Pro Scan中均被注释为未知结构。

    2.5 生菜bHLH基因的外显子和内含子结构分析

    基因家族各成员的基因结构往往呈现多样性,其中内含子和外显子的数量是基因家族进化过程中的重要标志,本研究根据生菜基因组信息获取了每一个基因的CDS序列信息,并绘制了外显子—内含子基因结构图,结果显示生菜bHLH基因家族内含子数目变化差异较大,介于0~10之间,且内含子的数量在不同的家族间差异较大。由图5可知,生菜bHLH基因家族分为内含子富集和内含子缺失2类,其中XP_023753528.1、XP_023733363.1、XP_023736226.1、XP_023750890.1、XP_023742628.1、PLY63858.1、PLY992 56.1、XP_023753746.1、XP_023751742.1、PLY91151.1、PLY63479.1、 PLY77525.1、 XP_023737733.1、 XP_023748410.1、PLY66263.1无内含子,PLY67254.1、XP_023746624.1、 XP_023736955.1、 XP_023737512.1、PLY62526.1、XP_023748593.1、XP_023735519.1、XP_023756084.1、XP_023750458.1、XP_023762189.1 仅 1个内含子,以上成员均属于内含子缺失组;
    PLY86498.1、XP_023767110.1含10个内含子(占比1.5%);
    XP_023754083.1、XP_023759112.1含9个内含子(占比1.5%),PLY73746.1、PLY96464.1含8个内含子(占比 1.5%),XP_023756964.1、XP_023748571.1、XP_023748493.1、 PLY67087.1、 PLY74352.1、 XP_023767039.1、 XP_023771981.1、 PLY62734.1、 XP_023736669.1、 XP_023746595.1、 XP_023751248.1、PLY79054.1含7个内含子(占比8.9%),含6个内含子的bHLH基因18个(占比13.3%),含5个内含子的bHLH基因15个(占比13.3%),以上成员均属内含子富集组。其中含有2个内含子的bHLH基因高达25个,所占成员总数最多,占比18.5%。

    图5 生菜bHLH家族基因外显子与内含子基因结构分布

    植物bHLH蛋白参与抗逆、生长发育、生物合成及信号传导等生理生化过程[22-23]。目前已从一些植物如拟南芥[8]、水稻[9]、人参[24]、西瓜[25]、茶树[26]、葡萄[27]、苹果[28]等分别鉴定出162、167、169、96、120、110、188个bHLH蛋白,但生菜bHLH家族的研究鲜见报道。本研究基于生菜全基因组数据,利用生物信息学的手段鉴定了生菜bHLH转录因子家族,并且对它们的理化性质、保守结构域、基因结构和系统进化和等情况进行了详细的分析。

    通过验证,去除冗余,共鉴定到135个bHLH蛋白。这些bHLH蛋白的蛋白质残基介于162~685之间,它们的等电点分布在0.63~9.51之间,相对分子量在17843.82~75409.15之间;
    不稳定指数分布在32.5~76.39之间。这135个蛋白包括100个细胞核蛋白,16个叶绿体蛋白,3个细胞质蛋白,1个内质网蛋白,1个细胞膜蛋白,1个线粒体蛋白;
    其中仅有1个蛋白有跨膜结构域。

    生菜bHLH蛋白bHLH保守结构域由两部分组成,碱性氨基酸区和HLH区。碱性氨基酸区位于N端,HLH区位于C端[7,29-30]。碱性氨基酸区含有高度保守的His5-Glu9-Arg13序列,第10位和第12位的Arg也高度保守,而HLH区第23位和第55位的Leu高度保守,且保守位点与西瓜[25]、莲[31]和芒果[32]bHLH蛋白的分析结果相似。135个生菜bHLH蛋白中的103个具有E-box的结合功能,59个具有结合G-box的结合功能,该结果与拟南芥(60.54%)和水稻(56.89%)[9]的分析结果相似。

    聚类分析表明,135个bHLH蛋白被划分为10个亚家族,共获得10条保守基序。由图可知,135个bHLH蛋白含有2~4个基序,相同家族的bHLH蛋白倾向于有相同的基序,不同的家族间bHLH蛋白基序数量和类型存在差异,推测正是由于这些特异motif的存在导致了bHLH家族基因功能的分化。外显子—内含子基因结构图,结果显示生菜bHLH基因家族内含子数目变化差异较大,介于0~10之间,且内含子的数量在不同的家族间差异较大。

    本研究在生菜全基因组中共鉴定出135个bHLH家族蛋白,共发掘出10条保守基序,其中基序motif 1和motif 2是生菜bHLH家族成员均包含的保守基序,为今后生菜bHLH家族蛋白的研究提供了基础。但本研究仅对生菜bHLH蛋白进行了功能预测,其具体功能还需进一步验证。

    猜你喜欢 基序内含子生菜 脆嫩爽口的生菜中老年保健(2022年6期)2022-08-19带TRS基序突变的新型冠状病毒威胁更大南方医科大学学报(2022年3期)2022-04-13芥蓝Aux/IAA家族基因生物信息学与表达分析浙江大学学报(农业与生命科学版)(2021年3期)2021-07-10线粒体核糖体蛋白基因中内含子序列间匹配特性分析内蒙古师范大学学报(自然科学汉文版)(2021年3期)2021-06-01鼠伤寒沙门菌小RNA GcvB 靶基因筛选和验证分析中国预防兽医学报(2020年8期)2020-11-05通过合成生物学可改造非豆科植物进行固氮(2020.8.8 iPlants)三农资讯半月报(2020年15期)2020-08-25生菜怎么吃更健康农家参谋(2020年5期)2020-06-15不同方向内含子对重组CHO细胞中神经生长因子表达的影响生物工程学报(2019年6期)2019-07-10更 正生物学通报(2019年1期)2019-02-15陆地棉GhDHN1基因结构及内含子生物信息学分析中国棉花(2018年6期)2018-07-06
    相关热词搜索: 转录 生菜 因子

    • 文学百科
    • 故事大全
    • 优美句子
    • 范文
    • 美文
    • 散文
    • 小说文章