Merremia mosaic Puerto Rico virus
            
            Basic Information
            
                
                    
                        |  Genus | 
                        
                             Begomovirus
                         | 
                    
                    
                    
                        | NCBI Assembly | 
                        GCF_000892695.1 | 
                    
                    
	   	    
                    
                        | Isolate | 
                        Puerto Rico | 
                    
		    
                    
                    
                        | Release date | 
                        2015/2/22 | 
                    
                    
                    
                    
                        | Submitter | 
                        Idris,A.M., Brown,J.K. | 
                    
                    
                    
                    
                        | Host | 
                        
                            
                         | 
                    
                    
                    
                    
                        | Vector | 
                        
                            
                         | 
                    
                    
                    
                        | Download | 
                        Genome 
                            
                            |GFF3 
                            |PEP 
                            |CDS |  
                    
                
            
            
	    Genomic Organization
	    
            
            
            JBrowse
            
	    
            
            Genome
            
            ACCGGATGGCCGACCGCTGCCCTTGGTGTCCCTCTCTCTCCCACGTGGTGCTTTAGTTTGAATTAAAGATATGTTTTATGCTTTGTCCAATCAGATTTGGTCTGGCGAGTCTAGGTATTCGTGTTCAAACTTAGTGACCAAGTATTACCGCATATAAGTACGAGTTATCTTATGTGGAGCCAGACATCTTTAATTCAAAATGCCTAAGCGGGATGCCCCGTGGCGTTCTATGGCGGGAACCTCCAAGGTTAGTCGAAACGCCAATTATTCTCCTGGTGGATCATCTGGCCCAAAATCCAACAGGGCCAATACTTGGGTTAATAGGCCCATGTACAGGAAGCCCAGGATATATCGGATGTATAGGACCCCCGATGTTCCAAGAGGCTGTGAAGGCCCATGTAAGGTGCAATCCTTTGAGCAACGCCATGATATCTCACATGTTGGCAAGGTGATGTGTATATCCGACGTGACACGTGGGAACGGTATAACTCACCGTGTTGGTAAGCGTTTTTGTGTTAAGTCCGTGTACATACTAGGCAAGATATGGATGGACGAGAACATCAAGTTGAAGAACCACACCAATAGTGTTATGTTTTGGTTAGTTAGGGATAGGAGACCATATGGCACTCCCATGGATTTTGGGCAAGTGTTTAATATGTTTGACAATGAGCCTAGTACTGCTACGGTCAAGAATGATCTCCGTGATCGTTTTCAAGTCATGCACAAATTTTATGCCAAGGTTACAGGTGGACAATATGCTAGTAATGAGCAGGCGATTGTTAAGCGTTTCTGGAAGGTGAACAGTCATGTTGTTTATAACCACCAGGAAGCCGCTAAGTACGAAAATCATACGGAGAATGCTCTATTATTGTACATGGCATGTACTCATGCCTCTAACCCTGTGTATGCTACTTTGAAAATTCGGATCTATTTTTATGATTCGATAATGAATTAATAAAATTTGAATTTTATTTCATGTTGTTCAAGTACATCATTTACATATTGTCTGTCCGTTGCATATGAGACAGCTCTAATTACATTATTAACTGAAATAACCCCTAAATTGTCTAAGAATTTCATAACAAGAAATTTGAATCTACTTAAATAAATCTGCCCAGAAGCTGTCGTCAAAGTCGTCCAGACTTGGAAATTGAAGTAGGCTTTGTGGAGATCCAACGCTTTCCTGAGGTTGTGGTTGGCGCGAATTTGTATGTGGAACACTCTGCTGTGGGTGAACATTGGACGGTCCACCCTGATTATTTTGAAATAGAGGGGATTTGGAACCTCCCAGATAAAAACGCCACTCGTTGCTTGAGCTGCAGTGATGGGTTCCCCTGTGCGTGAATCCATGGTTGCTGCAGTTAATGTGTAGGTAATATGAACAACCGCACTGCAGATCAATTCTTTTACGTCTCGTCTGCCTCTTTGCGAATCTATGACGAGGTTTGATTGACGGTGGAGTAGAGTGGTTCCTCAATGGTGACGAAGACGGCGTTTTTCTTTGCCCAGTCATTGAGTGTTTTGTTTTTTTCCTCTCCGAGATACTCCTTATATGATGAATGGGGGCCAGGATTGCAGAGGAAGATAGTGGGAATTCCACCTTTAATTTGAATTGGCTTTCCGTATTTGCAGTTTGATGGCCAATCCCTCTGGGCCCCCATGAATTCTTTAAAGTGCTTGAGATAATGCGGATCTACGTCATCGATGACGTTATACCATGCATCATTGGAGTATATCCTCGGGTTGAGATCTATATGTCCACATAGATAATTGTGAGGGCCCAGGCTACGGGCCCATATTGTTTTGCCCGTTCTTGATGGTCCTTCAACAATGATTGATATAGGTCTCAACGGCCGCGCAGCGGCATCGGAAATATTATCGTCGACCCACTTCATCATTATTTCCGGTACATTAATGAACGTGGACATTTGAAATGGAGGAACCCATGGTTCCGGAGGTTTATGGAATATTTTCGTTATATTTGAAACCAGATTGTGATATTGGAGGACGAAATGTTGTGGTTGTTGTTCCTTAATGATCTGCATCGCCTCTTCTGCAGAAGATGAATTCAACGCCGTCGCATATGTGTCGTTAGCAGATTGCTGACCTCCTCTAGCAGATCTGCCGTCGATTTGAAATTGTCCCCATTCGATTGTATCTCCGTCTTTGTCGATGTAGGACTTGACGTCGGAGCTAGACTTAGCTCCCTGTATGTTCGGATGGAAATGTGCTGACCTGGTTGGGGAAACCAAGTCGAAGAATCTGTTATTCTTGCACTGGTATTTCCCTTCGAACTGGATGAGCACGTGAAGATGAGGTTCCCCATTTTCGTGGAGTTCTCTGCATATTTTGATGAACTTCTTGTTGACAGGAGTGTTTAGGTTTTGTAATTGGGAAAGTGCCTCTTCTTTGGTTAGAGAGCACTTGGGGTATGTAATGAAATAATTCTTGGCATTTATTCTAAAACGCTGAACTGATGGCATTCTCGTAATAAAAAGGCTGGACACCAATTGAATGTACGGAGAGACACCAATTGAGCTCTTCAACTCCCCCCCCTTGTATTGGTGTCTGGGGTCTTATTTATAGTATACCTTCTATTCTTTAATTTTTTGACACGTGGAGGCCATCCGTTATAATATT
            
            
            
            ACCGGATGGCCGACCGCTGCCCTTGGTGTCCCTCTCTCTCCCACGTGACGCTTGGTGTGGTGCGCTCTCTCTCTTCTGACGTGGAGGATTTGTAAACCGTTCGATAAAGCTTATCGCGCTATGAGATTTGAAATTTGAATTATATGCACGGCTTTCTATGTATTAGGTAGCATATGAAGCGATAAGGTTTTCTGACACATTGTACTATGCCTAAGACGTGGCCCAATTAAATATTATCTGGCGAGTTATGTTAACTCTATTTTGAATCACTTATTCTATATATAACTAGTGGATATGAATATTTAATATCGTCTATTGACATTATAACTCCTTAAATTTTTGTATAAGAGATTTTTTAATATGTATTTGCTAAGATATAGACGTGGAACATCTTACTCACAACGACGATATAATACAGGTAATAATGTGTTTAAACGTGTATCATATGTTAAACGTAAGGATGGTAAGCGTCGATCGAGTCATGGAAATAATGTTCATGAAGATGGGAAGATGACGTCTCAACGCATACATGAAAATCAGTATGGGCCTGAATTTGTGATGTCTCAAAATTCAGCGTTATCCACATTCATTACTTTTCCTCATTTGGGGAAGACTCAACCTAATCGGTGCAGGTCATATATTAAGCTGAAACGGCTTCGTTTTAAAGGAACTGTTAAGATTGAACGTGTTCATGCGGATTTGAACATGGATGGTTTGCTCCCTAAGATTGAAGGTGTATTTTCCCTTGTAATTGTGGTGGATCGCAAACCCCATTTGAATGCTTCTGGATGTTTGCACTCATTTGACGAATTATTTGGTGCAAGGATCAACAGCCACGGGAATTTAGCTATTATCTCAGCTTTGAAAGATCGTTTTTATGTTCGTCATGTATTGAAACGTGTGTTGTCCGTGGAGAAAGACAGTACGATGATGGACCTGGAAGGATCGATCTTTTTTTCTAATAGGCGTTTTAATTGTTGGTCAAGTTTTAAAGATAATGACCATGATTCATGTAATGGTGTTTATGACAATATTAGCAAAAACGCCATATTAGTTTATTATTGTTGGATGTCGGATGTAATGTCTAAGGCATCAACATTTGTATCGTTCGACCTTGATTATGTTGGGTGAATAATAATAAATTGTAATGAGAAATAAAAATATAACTTTTATTTCAAAGATTTAGGCGGATTGGAATTACAGTTTGTGTTTATACATTCATGGACCGTTGTCCTAACTAACTCGTTTAATTGGGCCATTGACATTGTAATGTTTGATTGGGCCCGTTGTAACCCGGCTTGTGATGCTGAATCTCCTGGGTCTAGGACGCTTGCTCCCAAACGATTTAGTTCTTTATAGGGGTGTAACGCGTTGTCCAACTCTGAATCAGTATCTGTGTGGGCTAGCCCAATTGTACTCTTTGAAGCCCACGATTCACCTGGTCTTAATTCAATTGGGCCGGGTAACCCAACTCTTGATATTGATGTGGACCTCAACGTTTTCCGTTCCCATCGTCCGTAGTCCACATGTGTAAAATCCACATCTTTATGCGAGAATTGTTTGGATAGTATTTTGACCGTCGGTGCCCGGAATGGGATATCCACCGAATGTTTCGCCGTGGACAACTTCCATTTTCCCTTGAACTTGGCAAAATGCGTTCTGTGGTGGACATTTGTGTCGCTAACCCTGTAATACAGCTTCCATGGAATTGGGTCTTTTAGCGAGAAAAAGGACGATGAAAAATAGTGGAGATCTATGTTGCATCTAATTGGAAATGTCCATGACGCTTGTAAGGATTCGTTGTCAATCATCCTTTTGTCATGGATCTCCACAATAACTGTACCAGTTGCGTTTATGGGTACTTGTTGCCTGTACTCGATGACACAATGGTCTATTTTCATGCAGCTACGACTAAGTCTAGCTGTTAATTGAGATGCAGTTGAAGGAAATTGAAGGACTATCTCAGTTAGATCATGAGACAGCTGATATTCATCCCTATTGGATTCTATGTAATTAAAGGCATTTGGAGGATTTGCTAACTGAGAATCCATATATGAATAATTGGCCGCGCAGCGGAACTGTTTGAGTAATCTTATAGACTAACAAGGTTTATGGGTAAGAACAGATAGAACAAGACGAATAGTATATGACGGATGATGAATATGAGCAGGTTAAAGAAGATTATTGTGTTATGAAGGGCGAAGAGAATGAAGAGTAAAGGATGTTATTCTGGATAATTGTGTATATGATCCCTAACTGTGTTTCTGGAAATAAAATTAAAAGCTAAACTAATGAATATGAGCTAATGATAGAGAAATTAGCTATTTGTGAAGAAATTGATGCTGTGAGTTTTGTTATATGCCGTCGTGTTTATATAGACACTCATGTGTCTGTGTGTGTTATGAAGCGAGAGCGTTTCTTGTGGTATTTTCGTAATAAGAAGGCTGGACACCAATTGAATGTACGGAGAGACACCAATTGAGCTCTTCAACTCCCCCCCCTTGTATTGGTGTCTGGGGTCTTATTTATAGTATACCTTCTATTCTTTAATTTTTGGACACGTGGAGGCCATCCGCTATAATATT
            
            
            
            Gene Information
            
                
                
                    
                    
                        
                            
                                
                                    
                                        | 
                                            NCBI Accession
                                         | 
                                        YP_004429242.1
                                         | 
                                    
                                    
                                        | 
                                            Location
                                         | 
                                        200-955 | 
                                    
                                    
                                    
                                        | 
                                            Protein Name
                                         | 
                                        coat protein | 
                                    
                                    
                                        | 
                                            Coding Region
                                         | 
                                        ATGCCTAAGCGGGATGCCCCGTGGCGTTCTATGGCGGGAACCTCCAAGGTTAGTCGAAACGCCAATTATTCTCCTGGTGGATCATCTGGCCCAAAATCCAACAGGGCCAATACTTGGGTTAATAGGCCCATGTACAGGAAGCCCAGGATATATCGGATGTATAGGACCCCCGATGTTCCAAGAGGCTGTGAAGGCCCATGTAAGGTGCAATCCTTTGAGCAACGCCATGATATCTCACATGTTGGCAAGGTGATGTGTATATCCGACGTGACACGTGGGAACGGTATAACTCACCGTGTTGGTAAGCGTTTTTGTGTTAAGTCCGTGTACATACTAGGCAAGATATGGATGGACGAGAACATCAAGTTGAAGAACCACACCAATAGTGTTATGTTTTGGTTAGTTAGGGATAGGAGACCATATGGCACTCCCATGGATTTTGGGCAAGTGTTTAATATGTTTGACAATGAGCCTAGTACTGCTACGGTCAAGAATGATCTCCGTGATCGTTTTCAAGTCATGCACAAATTTTATGCCAAGGTTACAGGTGGACAATATGCTAGTAATGAGCAGGCGATTGTTAAGCGTTTCTGGAAGGTGAACAGTCATGTTGTTTATAACCACCAGGAAGCCGCTAAGTACGAAAATCATACGGAGAATGCTCTATTATTGTACATGGCATGTACTCATGCCTCTAACCCTGTGTATGCTACTTTGAAAATTCGGATCTATTTTTATGATTCGATAATGAATTAA | 
                                    
                                    
                                        | 
                                            Protein Sequence
                                         | 
                                        MPKRDAPWRSMAGTSKVSRNANYSPGGSSGPKSNRANTWVNRPMYRKPRIYRMYRTPDVPRGCEGPCKVQSFEQRHDISHVGKVMCISDVTRGNGITHRVGKRFCVKSVYILGKIWMDENIKLKNHTNSVMFWLVRDRRPYGTPMDFGQVFNMFDNEPSTATVKNDLRDRFQVMHKFYAKVTGGQYASNEQAIVKRFWKVNSHVVYNHQEAAKYENHTENALLLYMACTHASNPVYATLKIRIYFYDSIMN | 
                                    
                                
                            
                         
                     
                 
                
                
                    
                    
                        
                            
                                
                                    
                                        | 
                                            NCBI Accession
                                         | 
                                        YP_004429243.1
                                         | 
                                    
                                    
                                        | 
                                            Location
                                         | 
                                        952-1350 | 
                                    
                                    
                                    
                                        | 
                                            Protein Name
                                         | 
                                        REn | 
                                    
                                    
                                        | 
                                            Coding Region
                                         | 
                                        ATGGATTCACGCACAGGGGAACCCATCACTGCAGCTCAAGCAACGAGTGGCGTTTTTATCTGGGAGGTTCCAAATCCCCTCTATTTCAAAATAATCAGGGTGGACCGTCCAATGTTCACCCACAGCAGAGTGTTCCACATACAAATTCGCGCCAACCACAACCTCAGGAAAGCGTTGGATCTCCACAAAGCCTACTTCAATTTCCAAGTCTGGACGACTTTGACGACAGCTTCTGGGCAGATTTATTTAAGTAGATTCAAATTTCTTGTTATGAAATTCTTAGACAATTTAGGGGTTATTTCAGTTAATAATGTAATTAGAGCTGTCTCATATGCAACGGACAGACAATATGTAAATGATGTACTTGAACAACATGAAATAAAATTCAAATTTTATTAA | 
                                    
                                    
                                        | 
                                            Protein Sequence
                                         | 
                                        MDSRTGEPITAAQATSGVFIWEVPNPLYFKIIRVDRPMFTHSRVFHIQIRANHNLRKALDLHKAYFNFQVWTTLTTASGQIYLSRFKFLVMKFLDNLGVISVNNVIRAVSYATDRQYVNDVLEQHEIKFKFY | 
                                    
                                
                            
                         
                     
                 
                
                
                    
                    
                        
                            
                                
                                    
                                        | 
                                            NCBI Accession
                                         | 
                                        YP_004429244.1
                                         | 
                                    
                                    
                                        | 
                                            Location
                                         | 
                                        1097-1513 | 
                                    
                                    
                                    
                                        | 
                                            Protein Name
                                         | 
                                        TrAP | 
                                    
                                    
                                        | 
                                            Coding Region
                                         | 
                                        ATGACTGGGCAAAGAAAAACGCCGTCTTCGTCACCATTGAGGAACCACTCTACTCCACCGTCAATCAAACCTCGTCATAGATTCGCAAAGAGGCAGACGAGACGTAAAAGAATTGATCTGCAGTGCGGTTGTTCATATTACCTACACATTAACTGCAGCAACCATGGATTCACGCACAGGGGAACCCATCACTGCAGCTCAAGCAACGAGTGGCGTTTTTATCTGGGAGGTTCCAAATCCCCTCTATTTCAAAATAATCAGGGTGGACCGTCCAATGTTCACCCACAGCAGAGTGTTCCACATACAAATTCGCGCCAACCACAACCTCAGGAAAGCGTTGGATCTCCACAAAGCCTACTTCAATTTCCAAGTCTGGACGACTTTGACGACAGCTTCTGGGCAGATTTATTTAAGTAG | 
                                    
                                    
                                        | 
                                            Protein Sequence
                                         | 
                                        MTGQRKTPSSSPLRNHSTPPSIKPRHRFAKRQTRRKRIDLQCGCSYYLHINCSNHGFTHRGTHHCSSSNEWRFYLGGSKSPLFQNNQGGPSNVHPQQSVPHTNSRQPQPQESVGSPQSLLQFPSLDDFDDSFWADLFK | 
                                    
                                
                            
                         
                     
                 
                
                
                    
                    
                        
                            
                                
                                    
                                        | 
                                            NCBI Accession
                                         | 
                                        YP_004429245.1
                                         | 
                                    
                                    
                                        | 
                                            Location
                                         | 
                                        1434-2483 | 
                                    
                                    
                                    
                                        | 
                                            Protein Name
                                         | 
                                        Rep | 
                                    
                                    
                                        | 
                                            Coding Region
                                         | 
                                        ATGCCATCAGTTCAGCGTTTTAGAATAAATGCCAAGAATTATTTCATTACATACCCCAAGTGCTCTCTAACCAAAGAAGAGGCACTTTCCCAATTACAAAACCTAAACACTCCTGTCAACAAGAAGTTCATCAAAATATGCAGAGAACTCCACGAAAATGGGGAACCTCATCTTCACGTGCTCATCCAGTTCGAAGGGAAATACCAGTGCAAGAATAACAGATTCTTCGACTTGGTTTCCCCAACCAGGTCAGCACATTTCCATCCGAACATACAGGGAGCTAAGTCTAGCTCCGACGTCAAGTCCTACATCGACAAAGACGGAGATACAATCGAATGGGGACAATTTCAAATCGACGGCAGATCTGCTAGAGGAGGTCAGCAATCTGCTAACGACACATATGCGACGGCGTTGAATTCATCTTCTGCAGAAGAGGCGATGCAGATCATTAAGGAACAACAACCACAACATTTCGTCCTCCAATATCACAATCTGGTTTCAAATATAACGAAAATATTCCATAAACCTCCGGAACCATGGGTTCCTCCATTTCAAATGTCCACGTTCATTAATGTACCGGAAATAATGATGAAGTGGGTCGACGATAATATTTCCGATGCCGCTGCGCGGCCGTTGAGACCTATATCAATCATTGTTGAAGGACCATCAAGAACGGGCAAAACAATATGGGCCCGTAGCCTGGGCCCTCACAATTATCTATGTGGACATATAGATCTCAACCCGAGGATATACTCCAATGATGCATGGTATAACGTCATCGATGACGTAGATCCGCATTATCTCAAGCACTTTAAAGAATTCATGGGGGCCCAGAGGGATTGGCCATCAAACTGCAAATACGGAAAGCCAATTCAAATTAAAGGTGGAATTCCCACTATCTTCCTCTGCAATCCTGGCCCCCATTCATCATATAAGGAGTATCTCGGAGAGGAAAAAAACAAAACACTCAATGACTGGGCAAAGAAAAACGCCGTCTTCGTCACCATTGAGGAACCACTCTACTCCACCGTCAATCAAACCTCGTCATAG | 
                                    
                                    
                                        | 
                                            Protein Sequence
                                         | 
                                        MPSVQRFRINAKNYFITYPKCSLTKEEALSQLQNLNTPVNKKFIKICRELHENGEPHLHVLIQFEGKYQCKNNRFFDLVSPTRSAHFHPNIQGAKSSSDVKSYIDKDGDTIEWGQFQIDGRSARGGQQSANDTYATALNSSSAEEAMQIIKEQQPQHFVLQYHNLVSNITKIFHKPPEPWVPPFQMSTFINVPEIMMKWVDDNISDAAARPLRPISIIVEGPSRTGKTIWARSLGPHNYLCGHIDLNPRIYSNDAWYNVIDDVDPHYLKHFKEFMGAQRDWPSNCKYGKPIQIKGGIPTIFLCNPGPHSSYKEYLGEEKNKTLNDWAKKNAVFVTIEEPLYSTVNQTSS | 
                                    
                                
                            
                         
                     
                 
                
                
                    
                    
                        
                            
                                
                                    
                                        | 
                                            NCBI Accession
                                         | 
                                        YP_004429246.1
                                         | 
                                    
                                    
                                        | 
                                            Location
                                         | 
                                        361-1131 | 
                                    
                                    
                                    
                                        | 
                                            Protein Name
                                         | 
                                        movement protein | 
                                    
                                    
                                        | 
                                            Coding Region
                                         | 
                                        ATGTATTTGCTAAGATATAGACGTGGAACATCTTACTCACAACGACGATATAATACAGGTAATAATGTGTTTAAACGTGTATCATATGTTAAACGTAAGGATGGTAAGCGTCGATCGAGTCATGGAAATAATGTTCATGAAGATGGGAAGATGACGTCTCAACGCATACATGAAAATCAGTATGGGCCTGAATTTGTGATGTCTCAAAATTCAGCGTTATCCACATTCATTACTTTTCCTCATTTGGGGAAGACTCAACCTAATCGGTGCAGGTCATATATTAAGCTGAAACGGCTTCGTTTTAAAGGAACTGTTAAGATTGAACGTGTTCATGCGGATTTGAACATGGATGGTTTGCTCCCTAAGATTGAAGGTGTATTTTCCCTTGTAATTGTGGTGGATCGCAAACCCCATTTGAATGCTTCTGGATGTTTGCACTCATTTGACGAATTATTTGGTGCAAGGATCAACAGCCACGGGAATTTAGCTATTATCTCAGCTTTGAAAGATCGTTTTTATGTTCGTCATGTATTGAAACGTGTGTTGTCCGTGGAGAAAGACAGTACGATGATGGACCTGGAAGGATCGATCTTTTTTTCTAATAGGCGTTTTAATTGTTGGTCAAGTTTTAAAGATAATGACCATGATTCATGTAATGGTGTTTATGACAATATTAGCAAAAACGCCATATTAGTTTATTATTGTTGGATGTCGGATGTAATGTCTAAGGCATCAACATTTGTATCGTTCGACCTTGATTATGTTGGGTGA | 
                                    
                                    
                                        | 
                                            Protein Sequence
                                         | 
                                        MYLLRYRRGTSYSQRRYNTGNNVFKRVSYVKRKDGKRRSSHGNNVHEDGKMTSQRIHENQYGPEFVMSQNSALSTFITFPHLGKTQPNRCRSYIKLKRLRFKGTVKIERVHADLNMDGLLPKIEGVFSLVIVVDRKPHLNASGCLHSFDELFGARINSHGNLAIISALKDRFYVRHVLKRVLSVEKDSTMMDLEGSIFFSNRRFNCWSSFKDNDHDSCNGVYDNISKNAILVYYCWMSDVMSKASTFVSFDLDYVG | 
                                    
                                
                            
                         
                     
                 
                
                
                    
                    
                        
                            
                                
                                    
                                        | 
                                            NCBI Accession
                                         | 
                                        YP_004429247.1
                                         | 
                                    
                                    
                                        | 
                                            Location
                                         | 
                                        1170-2051 | 
                                    
                                    
                                    
                                        | 
                                            Protein Name
                                         | 
                                        nuclear shuttle protein | 
                                    
                                    
                                        | 
                                            Coding Region
                                         | 
                                        ATGGATTCTCAGTTAGCAAATCCTCCAAATGCCTTTAATTACATAGAATCCAATAGGGATGAATATCAGCTGTCTCATGATCTAACTGAGATAGTCCTTCAATTTCCTTCAACTGCATCTCAATTAACAGCTAGACTTAGTCGTAGCTGCATGAAAATAGACCATTGTGTCATCGAGTACAGGCAACAAGTACCCATAAACGCAACTGGTACAGTTATTGTGGAGATCCATGACAAAAGGATGATTGACAACGAATCCTTACAAGCGTCATGGACATTTCCAATTAGATGCAACATAGATCTCCACTATTTTTCATCGTCCTTTTTCTCGCTAAAAGACCCAATTCCATGGAAGCTGTATTACAGGGTTAGCGACACAAATGTCCACCACAGAACGCATTTTGCCAAGTTCAAGGGAAAATGGAAGTTGTCCACGGCGAAACATTCGGTGGATATCCCATTCCGGGCACCGACGGTCAAAATACTATCCAAACAATTCTCGCATAAAGATGTGGATTTTACACATGTGGACTACGGACGATGGGAACGGAAAACGTTGAGGTCCACATCAATATCAAGAGTTGGGTTACCCGGCCCAATTGAATTAAGACCAGGTGAATCGTGGGCTTCAAAGAGTACAATTGGGCTAGCCCACACAGATACTGATTCAGAGTTGGACAACGCGTTACACCCCTATAAAGAACTAAATCGTTTGGGAGCAAGCGTCCTAGACCCAGGAGATTCAGCATCACAAGCCGGGTTACAACGGGCCCAATCAAACATTACAATGTCAATGGCCCAATTAAACGAGTTAGTTAGGACAACGGTCCATGAATGTATAAACACAAACTGTAATTCCAATCCGCCTAAATCTTTGAAATAA | 
                                    
                                    
                                        | 
                                            Protein Sequence
                                         | 
                                        MDSQLANPPNAFNYIESNRDEYQLSHDLTEIVLQFPSTASQLTARLSRSCMKIDHCVIEYRQQVPINATGTVIVEIHDKRMIDNESLQASWTFPIRCNIDLHYFSSSFFSLKDPIPWKLYYRVSDTNVHHRTHFAKFKGKWKLSTAKHSVDIPFRAPTVKILSKQFSHKDVDFTHVDYGRWERKTLRSTSISRVGLPGPIELRPGESWASKSTIGLAHTDTDSELDNALHPYKELNRLGASVLDPGDSASQAGLQRAQSNITMSMAQLNELVRTTVHECINTNCNSNPPKSLK |