Corchorus golden mosaic virus


Basic Information

Genus Begomovirus
NCBI Assembly GCF_000873405.1
Isolate Viet Nam: Hanoi
Release date 2015/2/13
Submitter Ha,C., Coombs,S., Revill,P., Harding,R., Vu,M., Dale,J., Ha,C.V., Revill,P.A., Harding,R.M., Vu,M.T., Dale,J.L.
Host
Vector
Download Genome |GFF3 |PEP |CDS

Genomic Organization


JBrowse


Genome

NC_009644
ACCGTGCAGCAGCCGCCGCTTTTTCCGTACACTTTAATTTAAAATGAAATTGAAATTGATTGGAACTTTACTTTAGATGTGGCCAATGATATAACACGTGGTGGGTCATTTTAGACGCTTTTATCCTTATGACATAAGTTTCAATTTCATTTGAACTTTATAGCGCTATAAATTTAAATTTGAATGAATTTCAAGTACTGTCAGTGTTATAGTTCGAAAAGATGATGAAACGTGAGGCCCCATGGCGTACGAATGCTGGGACCTCCAAGGTACGTCGCGCTTTAAATTTCTCCCCTCGTAGTGGATTGGGCCCAAAAGCGTCTGCTTGGGTTAATCGGCCCATGTATAGAAAGCCCAGGATTTATCGAACGTATAGATCACCTGATGTTCCAAAGGGCTGTGAAGGCCCTTGTAAGGTACAGTCATTTGAACAGCGTCACGACATTTCTCATGTCGGCAAGGTCATGTGTATATCCGATGTCACACGTGGTAATGGTATCACGCATCGTGTTGGTAAACGTTTTTGTATTAAGTCTGTTTATATCCTAGGTAAAGTATGGATGGACGATAATATTAAACTTAAGAACCACACTAACAGTGTTATGTTCTGGTTAGTTAGGGATAGGAGACCGTATGGTACTCCCATGGATTTTGGACAGGTTTTTAACATGTATGATAACGAGCCGAGTACCGCTACTATCAAGAACGATCTCCGTGATCGTTACCAGGTTTTGCATAGGTTTGCGTCGAAGGTTACTGGTGGACAGTATGCTAGCAACGAACAGTCTCTTGTGAGACGATTCTGGAAGGTGAACAACCATGTGGTGTACAACCATCAAGAAGCTGCTAAGTACGATAATCACACTGAGAATGCATTATTATTGTATATGGCATGTACTCATGCCTCTAATCCTGTGTATGCTACTTTAAAGATACGGATCTATTTCTATGATTCGATATCAAATTAATAAATATTGAATTTTATTATATGATTTTCTTCTTCAACATGTACATATACGAGCGTATCAGCAGCATGTGCAATCGCTCTAATTACATTGTTTATGCCAATGGCACCTAAATCATCTAAGTAACGTCTAATTCGGGAAGAAAATACTTGAAAGAAACTCGAAATCCTCCATCTGGAGGTCGTCCGAACCCTGAAATTCAGGTAGCACTTGTGGAGCTGAAGTGCTTTCCTCAGGTTGTGGTTGAATCTTATCTGCAGCAATAGTAGGTGTCTCGCACCTAGATCTGTGACAGATATTATCTTGAAATAGAGGGGATTTGGAACCCTCCAAGTAAAAACGGAACTCTCTGCCTGATATGCAGTGATGGGATCCCCTGTGCGTAAATCCATCGTCTCTGCAGTGGATGCTCACATATATGGAGCAACCGCATTCCAGGTCAATTCGTCTCCGACGAATTACTTTCTTCGAGTGCCGATGTCGATTCTTGATTTGTGGTATTAAAGAATGGCTCTTCGATGGTGACGTAGATGACGTTTTTTTTGGCCCAGTCATTGATTGCTTTGTTCTTTTCCTCTTCGAAGAACTCCTTATATGATGAAGTAGGCCCAGGATTGCAGAGGAAGATTGTTGGAATCCCTCCATTTATTTGAATTGGTTTGCCGTACTTGCAGTTGGACTGCCAGTCTCTCTGGGCCCCCATAAATTCCTTCATATGCTTTAGATAGTGCGGGTCGACATCATCAATGACGTTGTACCAGGCCTCATTTGAATACACTTTTGGGCTTAGATCAAGATGTCCACAAAGATAATTGTGACGACCCAAACTTCTGGCCCATAATGTTTTCCCTGTCCTAGATGGACCTTCAATGATAATAGATATCGGCCTAAAGGGCCGCGCAGCGGCATCCATTATATTATCGTTAACCCACTGATTAATAACAGCAGGAACGTTATTAAACGATGATAGTGGGAACGGTGGCTCAAAAACATTAACTGGAGGAGCAAAGATCCTCTCCAAATTTTGATTAAGATTATGAAATTGTAATACATAATCCTTTGGAACTAACTCCTTAATGATATTAAGAGCCTCGTCCTTACTTCCGCTGTTAAGCGCCTTTGCATAAGCCTCATTAACTGTCTGTTGACCGCCTCTCGCCGATCTTCCGTCCACCTGGAAAGTGCCCCATTCGCAGAACACTCCATCTTTTTCGATATATGATTTGGCGTCGGAGGAGGAGCGCGCAGTTTCAATGTGACAGTGGAATTGACGTGAGTTCTGTGGATGGGAGAGGTCGAATAATCGACAATTTGTGCAGATGAATTTTTTCTGGAATTGAACCAAGGCATGCAGGTGAGGCGACCCATCTTGATGTTTTTCCTCACAGACTCTAATATAAACGATGTTGGTTGGAAGGGTTAATGCTTGTATTTGGTCTAAGGCTGACTCTTTAGTAACTGGGCATTTTGGCCACGTGAGGAAAAAAGAAACGCCTTGTTTCTTAAAACGACCGCTCATCTTGCGTTTTAAATCGGGGACAATCAAAGTCTCTGATATCCGATATATCGGGGACAATATATAGGTCTCCCAATATTTGTACTAAGAGCGTGCAGAGCCTTTTTATACGGACGCGAAGGGCATTATAGTCATTTCCCTTAGTAATTCAGCGTGTTTTTTGGGTTCCAATCCGCTGCTGCACGCTCCTATTATT

NC_009646
ACCGTGCAGCAGCCGCCGCTTTTTCCGTACACTTTAATTTGAATTGGGCTCCAGTTATTGAAAGCGACGTTTATAAACAAGTGGCCACGATTGCGCCACGTGTTGCAATAATAGCCATGGATAAAAATTATATGTGAGCCACGCGATATTTATCCAAAATTGAAAAAAAAGACCGCGCGTTCATGGATGATAATATTGGATTAACTAATTTTAGAAATGATTTCGTCCAATCATTGATTGACATTGGGGTTTCATTATAACTGAATGGCATCATCCAACTATAAATAACAGAAAATTGTTTAAAAGATAAATTAGCCTGTGATATTTTTTTTTTGTTTGTAAATATGTATATTGGTAAAGGTATACGTTATAGCAACAACACCATGAATCGTGCTAAGTACAACAGACCTGTTGGTCGTCGATCTTTTGTGTATAGGCGCGGTCCTAAAGTACGTGTTAATCAGTCTGTCCCAAAGTCACAGGGTGACAAGATGACCAGACAGCGTATCCATGAAAATCAGTATGGCGTACAGTATTCCCTATTAAACAATACGTCCAGTGTGTCTTTTATCACATATCCTAGATTAGGTGGGCCTGAGCCCAATAGAAGTCGGGCTTACATAAAATTGAATAGGCTTCGTTACAAGGGGACTGTTAATATTGAATGTTCAGATCCAGATGTTGGAATGGATCCCAATCGTGGTGGGCTTTCTGGTGTCTTCACTCTGGCTATTGTTGTTGATAGGAAACCTCATGTTGGACCTACTGGTTCATTGCCATCATTTGACGATCTGTTTGGTTGTAATCTGTACAGCAATGGGAGCCTTGATATCTCACCCCAGATGAAGCAGCGTTACTACATTCGGCACGTACACAAACGTGTCGTATCTTATGAGAAGGATTCTATCATGATGAACATATCGGGCAATATGGGATTATCTTCCCCTAAATATGTATGTTGGTCCTCATTCAAGGACCTTGATGTGGATAGTTGTACTGGGAGCTATTCTAATCTAGCTAAGAATGCTCTTTTAGTTTATTATTGTTGGGTTTCGAACATGCCTTCTAAGGCATCATCATTTGTATCTTTTGACCTGGATTATCTGGGTTAAATTAATAAAAATATATTTGCAATAATAAGAATTGTTTGAAATTGGTAATTGCATTTATAATTCATAATGGTTTAGCCTGTTGAGGCGTACAATTTCTATTAATGCATAAATCGACAGTGCTATTGACAAGTTCTTGTAATTGTGCCCTGCTAAGTGTGATGTTGGACTCGGACCGCGCAGCTGCAACCAGTGATGCCGAGTCACCTGGGTCTAGCATGCTTGTGCTCAGCCTGTGAAGCTCTCTGTATGGGTGTCTGTTATGGGCTACGTCGGACTCTGTCTCGTTAATGTCCACTCCAACTGAGCTCCTTGTGGCCCAAGATTCACCGGGCCTTAGTTCGATTGCCGAATGGAGGGCTGACCTTGATGATGAAGCTGATTTGATCAGCTTCCTCTCGACCTTCCCATATTCCACATGGGAGAAGTCTATATCTTTCCCGGTGAACTGCTTAGATAGTATCTTCACGGTGGGAGAGCGAAAAACGACATCAACGGAGTGCTTGGCTGTGGACATCTTCAGCTTGCCCTTGAACTTGGCGAAATGTGTTCCCTGGTTGACATTAGTGTCTGACACCCTGTAGTACAGCTTCCATGGAATAGGATCCTTGAGTGAGAAGAAGGATGCAGAGAAGTAGTGGAGATCAATGTTGCATCTAATTGGGAAGGTGTATGTCGTCTGTAATGACTCGTTGTCATTCATGCGTGTGTCATGAATCTCGACAATTACTGAGCCAGAAGCGTTAATTGGCACCTGTTGTCTGTACTCGATGACACAATGATCTATCTTCATGCACCTCCTCCTTACAGTTGCACCCCATTGTTCTGCAGTTGATGGGAATTGCAGCACAATCTCTGTGAGATCATGGGTGAGTCTGTACTCGTCTCTATTAGACTCAATATAATTAAAAGAATTGGGAGCGTTAGCTAATTGAGAACTCATGAGGAGATGTTGGTCGCGCAGCGAAACCAGAAAAAATTGTTATGGATGATAAACTAATGACTGAAGAAATGAGACATTATTTGTCTGAGATAATGAAGAGGATAGTCTGTTCATAAGAACATCTGGGTATGGTGTTTGCGTTTTGCGATGGAACTGGTTATATAGACAGATAGATGTACGGATCTAATTGGAGACAACATTCTCTCTCTTTCTCTCTCATCTCTCTCATCTCTCTCTTAATTTCAATTAAATCTTGCTTAATTACGGATAATGATGTTGTTATTATTAAGAGAGATGTTATTAAGAATGATATAATCTCGGACTTTCTATTTTAAATGAAACGACAATCGACTCTGCGTTTTAAATCGGGGACAATCAAAGTCTCTGATATCCGATATATCGGGGACAATATATAGGTCTCCCAATTTATTGGTACGGGAGTCAGCAGCGACATAGACCCTAAACTTCGAGGGCAAGTTGTGTCTTTTCACTATTCAACAAAGGAAAGGACAAATAAAAGTCAGGGGTATTTTGGGTATTTCACTTTATAGTGGCAAAATGGTAAATAACACACCGCTGCTGCACGACCCTATTATT

Gene Information

NCBI Accession YP_001333684.1
Location 225-968
Gene Name AV1
Protein Name CP protein
Coding Region ATGAAACGTGAGGCCCCATGGCGTACGAATGCTGGGACCTCCAAGGTACGTCGCGCTTTAAATTTCTCCCCTCGTAGTGGATTGGGCCCAAAAGCGTCTGCTTGGGTTAATCGGCCCATGTATAGAAAGCCCAGGATTTATCGAACGTATAGATCACCTGATGTTCCAAAGGGCTGTGAAGGCCCTTGTAAGGTACAGTCATTTGAACAGCGTCACGACATTTCTCATGTCGGCAAGGTCATGTGTATATCCGATGTCACACGTGGTAATGGTATCACGCATCGTGTTGGTAAACGTTTTTGTATTAAGTCTGTTTATATCCTAGGTAAAGTATGGATGGACGATAATATTAAACTTAAGAACCACACTAACAGTGTTATGTTCTGGTTAGTTAGGGATAGGAGACCGTATGGTACTCCCATGGATTTTGGACAGGTTTTTAACATGTATGATAACGAGCCGAGTACCGCTACTATCAAGAACGATCTCCGTGATCGTTACCAGGTTTTGCATAGGTTTGCGTCGAAGGTTACTGGTGGACAGTATGCTAGCAACGAACAGTCTCTTGTGAGACGATTCTGGAAGGTGAACAACCATGTGGTGTACAACCATCAAGAAGCTGCTAAGTACGATAATCACACTGAGAATGCATTATTATTGTATATGGCATGTACTCATGCCTCTAATCCTGTGTATGCTACTTTAAAGATACGGATCTATTTCTATGATTCGATATCAAATTAA
Protein Sequence MKREAPWRTNAGTSKVRRALNFSPRSGLGPKASAWVNRPMYRKPRIYRTYRSPDVPKGCEGPCKVQSFEQRHDISHVGKVMCISDVTRGNGITHRVGKRFCIKSVYILGKVWMDDNIKLKNHTNSVMFWLVRDRRPYGTPMDFGQVFNMYDNEPSTATIKNDLRDRYQVLHRFASKVTGGQYASNEQSLVRRFWKVNNHVVYNHQEAAKYDNHTENALLLYMACTHASNPVYATLKIRIYFYDSISN

NCBI Accession YP_001333685.1
Location 965-1357
Gene Name AC3
Protein Name REn protein
Coding Region ATGGATTTACGCACAGGGGATCCCATCACTGCATATCAGGCAGAGAGTTCCGTTTTTACTTGGAGGGTTCCAAATCCCCTCTATTTCAAGATAATATCTGTCACAGATCTAGGTGCGAGACACCTACTATTGCTGCAGATAAGATTCAACCACAACCTGAGGAAAGCACTTCAGCTCCACAAGTGCTACCTGAATTTCAGGGTTCGGACGACCTCCAGATGGAGGATTTCGAGTTTCTTTCAAGTATTTTCTTCCCGAATTAGACGTTACTTAGATGATTTAGGTGCCATTGGCATAAACAATGTAATTAGAGCGATTGCACATGCTGCTGATACGCTCGTATATGTACATGTTGAAGAAGAAAATCATATAATAAAATTCAATATTTATTAA
Protein Sequence MDLRTGDPITAYQAESSVFTWRVPNPLYFKIISVTDLGARHLLLLQIRFNHNLRKALQLHKCYLNFRVRTTSRWRISSFFQVFSSRIRRYLDDLGAIGINNVIRAIAHAADTLVYVHVEEENHIIKFNIY

NCBI Accession YP_001333686.1
Location 1095-1610
Gene Name AC2
Protein Name TrAP protein
Coding Region ATGGAGGGATTCCAACAATCTTCCTCTGCAATCCTGGGCCTACTTCATCATATAAGGAGTTCTTCGAAGAGGAAAAGAACAAAGCAATCAATGACTGGGCCAAAAAAAACGTCATCTACGTCACCATCGAAGAGCCATTCTTTAATACCACAAATCAAGAATCGACATCGGCACTCGAAGAAAGTAATTCGTCGGAGACGAATTGACCTGGAATGCGGTTGCTCCATATATGTGAGCATCCACTGCAGAGACGATGGATTTACGCACAGGGGATCCCATCACTGCATATCAGGCAGAGAGTTCCGTTTTTACTTGGAGGGTTCCAAATCCCCTCTATTTCAAGATAATATCTGTCACAGATCTAGGTGCGAGACACCTACTATTGCTGCAGATAAGATTCAACCACAACCTGAGGAAAGCACTTCAGCTCCACAAGTGCTACCTGAATTTCAGGGTTCGGACGACCTCCAGATGGAGGATTTCGAGTTTCTTTCAAGTATTTTCTTCCCGAATTAG
Protein Sequence MEGFQQSSSAILGLLHHIRSSSKRKRTKQSMTGPKKTSSTSPSKSHSLIPQIKNRHRHSKKVIRRRRIDLECGCSIYVSIHCRDDGFTHRGSHHCISGREFRFYLEGSKSPLFQDNICHRSRCETPTIAADKIQPQPEESTSAPQVLPEFQGSDDLQMEDFEFLSSIFFPN

NCBI Accession YP_001333687.1
Location 1405-2484
Gene Name AC1
Protein Name rep protein
Coding Region ATGAGCGGTCGTTTTAAGAAACAAGGCGTTTCTTTTTTCCTCACGTGGCCAAAATGCCCAGTTACTAAAGAGTCAGCCTTAGACCAAATACAAGCATTAACCCTTCCAACCAACATCGTTTATATTAGAGTCTGTGAGGAAAAACATCAAGATGGGTCGCCTCACCTGCATGCCTTGGTTCAATTCCAGAAAAAATTCATCTGCACAAATTGTCGATTATTCGACCTCTCCCATCCACAGAACTCACGTCAATTCCACTGTCACATTGAAACTGCGCGCTCCTCCTCCGACGCCAAATCATATATCGAAAAAGATGGAGTGTTCTGCGAATGGGGCACTTTCCAGGTGGACGGAAGATCGGCGAGAGGCGGTCAACAGACAGTTAATGAGGCTTATGCAAAGGCGCTTAACAGCGGAAGTAAGGACGAGGCTCTTAATATCATTAAGGAGTTAGTTCCAAAGGATTATGTATTACAATTTCATAATCTTAATCAAAATTTGGAGAGGATCTTTGCTCCTCCAGTTAATGTTTTTGAGCCACCGTTCCCACTATCATCGTTTAATAACGTTCCTGCTGTTATTAATCAGTGGGTTAACGATAATATAATGGATGCCGCTGCGCGGCCCTTTAGGCCGATATCTATTATCATTGAAGGTCCATCTAGGACAGGGAAAACATTATGGGCCAGAAGTTTGGGTCGTCACAATTATCTTTGTGGACATCTTGATCTAAGCCCAAAAGTGTATTCAAATGAGGCCTGGTACAACGTCATTGATGATGTCGACCCGCACTATCTAAAGCATATGAAGGAATTTATGGGGGCCCAGAGAGACTGGCAGTCCAACTGCAAGTACGGCAAACCAATTCAAATAAATGGAGGGATTCCAACAATCTTCCTCTGCAATCCTGGGCCTACTTCATCATATAAGGAGTTCTTCGAAGAGGAAAAGAACAAAGCAATCAATGACTGGGCCAAAAAAAACGTCATCTACGTCACCATCGAAGAGCCATTCTTTAATACCACAAATCAAGAATCGACATCGGCACTCGAAGAAAGTAATTCGTCGGAGACGAATTGA
Protein Sequence MSGRFKKQGVSFFLTWPKCPVTKESALDQIQALTLPTNIVYIRVCEEKHQDGSPHLHALVQFQKKFICTNCRLFDLSHPQNSRQFHCHIETARSSSDAKSYIEKDGVFCEWGTFQVDGRSARGGQQTVNEAYAKALNSGSKDEALNIIKELVPKDYVLQFHNLNQNLERIFAPPVNVFEPPFPLSSFNNVPAVINQWVNDNIMDAAARPFRPISIIIEGPSRTGKTLWARSLGRHNYLCGHLDLSPKVYSNEAWYNVIDDVDPHYLKHMKEFMGAQRDWQSNCKYGKPIQINGGIPTIFLCNPGPTSSYKEFFEEEKNKAINDWAKKNVIYVTIEEPFFNTTNQESTSALEESNSSETN

NCBI Accession YP_001333688.1
Location 2031-2333
Gene Name AC4
Protein Name AC4 protein
Coding Region ATGGGTCGCCTCACCTGCATGCCTTGGTTCAATTCCAGAAAAAATTCATCTGCACAAATTGTCGATTATTCGACCTCTCCCATCCACAGAACTCACGTCAATTCCACTGTCACATTGAAACTGCGCGCTCCTCCTCCGACGCCAAATCATATATCGAAAAAGATGGAGTGTTCTGCGAATGGGGCACTTTCCAGGTGGACGGAAGATCGGCGAGAGGCGGTCAACAGACAGTTAATGAGGCTTATGCAAAGGCGCTTAACAGCGGAAGTAAGGACGAGGCTCTTAATATCATTAAGGAGTTAG
Protein Sequence MGRLTCMPWFNSRKNSSAQIVDYSTSPIHRTHVNSTVTLKLRAPPPTPNHISKKMECSANGALSRWTEDRREAVNRQLMRLMQRRLTAEVRTRLLISLRS

NCBI Accession YP_001333689.1
Location 345-1112
Gene Name BV1
Protein Name NSP protein
Coding Region ATGTATATTGGTAAAGGTATACGTTATAGCAACAACACCATGAATCGTGCTAAGTACAACAGACCTGTTGGTCGTCGATCTTTTGTGTATAGGCGCGGTCCTAAAGTACGTGTTAATCAGTCTGTCCCAAAGTCACAGGGTGACAAGATGACCAGACAGCGTATCCATGAAAATCAGTATGGCGTACAGTATTCCCTATTAAACAATACGTCCAGTGTGTCTTTTATCACATATCCTAGATTAGGTGGGCCTGAGCCCAATAGAAGTCGGGCTTACATAAAATTGAATAGGCTTCGTTACAAGGGGACTGTTAATATTGAATGTTCAGATCCAGATGTTGGAATGGATCCCAATCGTGGTGGGCTTTCTGGTGTCTTCACTCTGGCTATTGTTGTTGATAGGAAACCTCATGTTGGACCTACTGGTTCATTGCCATCATTTGACGATCTGTTTGGTTGTAATCTGTACAGCAATGGGAGCCTTGATATCTCACCCCAGATGAAGCAGCGTTACTACATTCGGCACGTACACAAACGTGTCGTATCTTATGAGAAGGATTCTATCATGATGAACATATCGGGCAATATGGGATTATCTTCCCCTAAATATGTATGTTGGTCCTCATTCAAGGACCTTGATGTGGATAGTTGTACTGGGAGCTATTCTAATCTAGCTAAGAATGCTCTTTTAGTTTATTATTGTTGGGTTTCGAACATGCCTTCTAAGGCATCATCATTTGTATCTTTTGACCTGGATTATCTGGGTTAA
Protein Sequence MYIGKGIRYSNNTMNRAKYNRPVGRRSFVYRRGPKVRVNQSVPKSQGDKMTRQRIHENQYGVQYSLLNNTSSVSFITYPRLGGPEPNRSRAYIKLNRLRYKGTVNIECSDPDVGMDPNRGGLSGVFTLAIVVDRKPHVGPTGSLPSFDDLFGCNLYSNGSLDISPQMKQRYYIRHVHKRVVSYEKDSIMMNISGNMGLSSPKYVCWSSFKDLDVDSCTGSYSNLAKNALLVYYCWVSNMPSKASSFVSFDLDYLG

NCBI Accession YP_001333690.1
Location 1174-2052
Gene Name BC1
Protein Name MP protein
Coding Region ATGAGTTCTCAATTAGCTAACGCTCCCAATTCTTTTAATTATATTGAGTCTAATAGAGACGAGTACAGACTCACCCATGATCTCACAGAGATTGTGCTGCAATTCCCATCAACTGCAGAACAATGGGGTGCAACTGTAAGGAGGAGGTGCATGAAGATAGATCATTGTGTCATCGAGTACAGACAACAGGTGCCAATTAACGCTTCTGGCTCAGTAATTGTCGAGATTCATGACACACGCATGAATGACAACGAGTCATTACAGACGACATACACCTTCCCAATTAGATGCAACATTGATCTCCACTACTTCTCTGCATCCTTCTTCTCACTCAAGGATCCTATTCCATGGAAGCTGTACTACAGGGTGTCAGACACTAATGTCAACCAGGGAACACATTTCGCCAAGTTCAAGGGCAAGCTGAAGATGTCCACAGCCAAGCACTCCGTTGATGTCGTTTTTCGCTCTCCCACCGTGAAGATACTATCTAAGCAGTTCACCGGGAAAGATATAGACTTCTCCCATGTGGAATATGGGAAGGTCGAGAGGAAGCTGATCAAATCAGCTTCATCATCAAGGTCAGCCCTCCATTCGGCAATCGAACTAAGGCCCGGTGAATCTTGGGCCACAAGGAGCTCAGTTGGAGTGGACATTAACGAGACAGAGTCCGACGTAGCCCATAACAGACACCCATACAGAGAGCTTCACAGGCTGAGCACAAGCATGCTAGACCCAGGTGACTCGGCATCACTGGTTGCAGCTGCGCGGTCCGAGTCCAACATCACACTTAGCAGGGCACAATTACAAGAACTTGTCAATAGCACTGTCGATTTATGCATTAATAGAAATTGTACGCCTCAACAGGCTAAACCATTATGA
Protein Sequence MSSQLANAPNSFNYIESNRDEYRLTHDLTEIVLQFPSTAEQWGATVRRRCMKIDHCVIEYRQQVPINASGSVIVEIHDTRMNDNESLQTTYTFPIRCNIDLHYFSASFFSLKDPIPWKLYYRVSDTNVNQGTHFAKFKGKLKMSTAKHSVDVVFRSPTVKILSKQFTGKDIDFSHVEYGKVERKLIKSASSSRSALHSAIELRPGESWATRSSVGVDINETESDVAHNRHPYRELHRLSTSMLDPGDSASLVAAARSESNITLSRAQLQELVNSTVDLCINRNCTPQQAKPL