DCAR_029743

Resource Type: 
Gene
Name: 
DCAR_029743
Identifier: 
DCAR_029743.gene
Locus Tag: 
DCAR_029743
Publication: 
Iorizzo M, Ellison S, Senalik D, Zeng P, Satapoomin P, Huang J, Bowman M, Iovene M, Sanseverino W, Cavagnaro P, Yildiz M, Macko-Podgórni A, Moranska E, Grzebelus E, Grzebelus D, Ashrafi H, Zheng Z, Cheng S, Spooner D, Van Deynze A, Simon P. A high-quality carrot genome assembly provides new insights into carotenoid accumulation and asterid genome evolution.. Nature genetics. 2016 06; 48(6):657-66.
Relationship: 
There are 3 relationships.
Relationships
The mRNA, DCAR_029743, is a part of gene, DCAR_029743.
The genetic_marker, MK011471 9_12887065, is located in gene, DCAR_029743.
The genetic_marker, MK006022 K3466, is located in gene, DCAR_029743.
Loading content
Analysis: 
NameDescription

An orange, doubled-haploid, Nantes-type carrot (DH1) was used for genome sequencing. We used BAC end sequences and a newly developed linkage map with 2,075 markers to correct 135 scaffolds with one or more chimeric regions. The resulting v2.0 assembly spans 421.5 Mb and contains 4,907 scaffolds (N50 of 12.7 Mb), accounting for ∼90% of the estimated genome size of 473 Mb. The scaftig N50 of 31.2 kb is similar to those of other high-quality genome assemblies such as potato and pepper. About 86% (362 Mb) of the assembled genome is included in only 60 superscaffolds anchored to the nine pseudomolecules. The longest superscaffold spans 30.2 Mb, 85% of chromosome 4.

There are a few different naming schemes for this assembly. First there is the
Authors' original naming scheme: Sequences with DCARv2 prefix are the original assembly as submitted to NCBI. These are labelled DCARv2_Chr1 through DCARv2_Chr9 for the chromosome pseudomolecules, DCARv2_MT and DCARv2_PT for the organellar assemblies, DCARv2_B1 and up for unincorporated superscaffolds, DCARv2_S26.1 and up for unincorporated scaffolds, and DCARv2_C10542132 and up for unincorporated contigs. A file with sequences using this naming scheme can be downloaded from the File: link below.
These sequences can be viewed in JBrowse here.

Phytozome genome ID 388: The authors' sequences and gene predictions were also submitted to Phytozome, and can be accessed at this address: https://phytozome-next.jgi.doe.gov/info/Dcarota_v2_0

LNRQ01: These sequences were then assigned GenBank accession numbers starting at LNRQ01000001.1 which corresponds to DCARv2_Chr1, up to LNRQ01004826.1 which corresponds to an unincorporated contig, DCARv2_C10750146. These reside in bioproject PRJNA268187, which is a subproject of umbrella project PRJNA285926.

Assembly GCA_001625215.1: The genome assembly was later defined an accession number GCA_001625215.1 for assembly ASM162521v1 which consists of only the 9 chromosome sequences and the plastid assembly, which have accession numbers from CM004278.1 to CM004286.1 for the chromosomes and CM004358.1 for the plastid. The mitochondrial genome was not included because it is classified as an incomplete sequence.

RefSeq: The assembly was then later added to RefSeq, and there another new set of identifiers was defined from NC_030381.1 to NC_030389.1 for the chromosomes, and from NW_016089425.1 to NW_016094239.1 for unincorporated scaffolds and contigs. These reside in bioproject PRJNA326436. Note that NCBI substituted different assembled organellar genomes from different genotypes for the RefSeq records.

The NCBI Sequence report lists the correspondences between the various naming methods

Link to the LNRQ01000000.1 master record at NCBI

Raw Reads: Link to SRA accessions used for the genome assembly

This genome is available in the CarrotOmics Blast Search

For gene model prediction, mobile element–related repeats were masked using RepeatMasker. De novo prediction using AUGUSTUS v2.5.5, GENSCAN v.1.1.0, and GlimmerHMM-3.0.1 was trained using model species A. thaliana and S. lycoperisum training sets. The protein sequences of S. lycoperisum, Solanum tuberosum, A. thaliana, Brassica rapa, and Oryza sativa were mapped to the carrot genome using TBLASTN (BLAST All 2.2.23) and analyzed with GeneWise version 2.2.0. Carrot ESTs were aligned to the genome using BLAT and analyzed with PASA to detect spliced gene models. RNA-seq reads from 20 DH1 libraries were aligned with TopHat 2.0.9. Transcripts were predicted by Cufflinks. All gene models produced by de novo prediction, protein homology searches, and prediction and transcript-based evidence were integrated using GLEAN v1.1. Putative gene functions were assigned using the best BLASTP match to SwissProt and TrEMBL databases. Gene motifs and domains were determined with InterProScan version 4.7 against the ProDom, PRINTS, Pfam, SMART, PANTHER, and PROSITE protein databases. GO IDs for each gene were obtained from the corresponding InterPro entries. All genes were aligned against KEGG (release 58) proteins.

Data from this analysis can be viewed in JBrowse here.

Loading content
Transcripts: 
Transcript NameIdentifierTypeLocation
DCAR_029743DCAR_029743.mRNAmRNADCARv2_Chr9:12887054..12912728
Sequence: 
ATGGCAGAAATCGACGACAAACCGTCTCAACCCTCCCCTTCCATCTCCAA
ATCTCCGGTGACCTACGCCATCTGGCCCCCCTCCCAACGCACCTGCAACG
CCGTCACCAAACGCCTCCTCGAGACGCTCTCCTCCCCCTCTGTCATCTCT
AAGCGCTACGACACGCTTCCCGAGGAAAAGGCGCGAGTGATTGCCGCCAA
GATCGAGGGCGAGGCGTTCGCCACCGCCTTCATCACCGCGTCGCCCGATG
ACGATGGGATTGAGATTCTCCAGGGCTACGAGTCAAAAACACTGCTTCTG
ATCTCGCATGCTTTTGAGGCATGTAATCATTTTTCTTCACTGATTTTATT
GCTCACTTCTAAGACTGGTGATTTCAGACGACCTCTCCGCGCCTTGTTTA
TCGCTCTAAATCTCTATTTGCTTTCTCTCTCTAGAATTTACACACTTTTT
CCAAAATCATTGTGACATTAACTTCATATAGTATTAATTATTTATTGAAT
TTTCATAGTAATGAATTTTCTATATATATATTTAAAATATTTTTATCAAA
ATTTTCATTTCCACACATATATAAGATGAAATATTAATACTTATTACATT
CTATGATAATTTTTTATAGAGTGTAATAAAAAAAAATCATTATCATAATA
CTGCCTCCATTTCAAATTACATGTCCACTTTCAAAAAAGCACATAGTTTA
AGAAAAGTGGATTTTGAGGGGGAAAAAAAAGGTGTATTAAGTCATTAATT
GAACCTAATATGTGGTATATGGTAGATTTTGGAAACATAAATTTGAAATA
TGTGAAGGAGAGTTGATTTTGGAAATATAAATTTACATTGAAAGTTGAAG
TGGACAAGTATTCTAATTTTTTTTTTCTTAAATTGGACATGTATTTTGAA
ACTGATGGAGTATAATATATATATATATTCTATGTAATTATATTTATGAA
TAGATGCAACGCATAACGATGATAATAAATATTACAAATAATTTTAATCA
GATATATTAATTGTGATAATGAGCTACAATTGTTCGGCACATGCACAATT
ATATATCTAATTTTTATCTCCTTGAATCGGCAATCTTTGTCTTGTTAACT
CTTGAGCTTCTGTCCTAATTTTTGAAGGTGTGCTACAAAACAAACTCCTG
CAGCATCCCTGAATTTGAACATCATTATCTGCCACAAGGTTTTACTTGAT
GAAGATTCAAATCAAATCATAACTCTAAAGACAGTATCTTTGAGACACCA
AGGCTTGCTTTCATAATATGGACTTGAGATGATAGTATGATTCCCTGTTG
ATATTGCTGTAAAGAAATTAGCTGTCTTTTAGAGCTTCCGTCAATGTTAC
TGTCAGATATAAACAATCTGTCGTCATCTACAACTAGTTGTACTGTGTAG
CTATACTGTCAAATAATTAACAGTAACTTCCCCTTATTTTTGCTATCATT
CCTTTGTACGACTTGACTTGAACAATTTAATGAACATCTTCCAAGTGTAT
ATTTATTACATAAGAGTTATTACTGGAGCTAGATAGACATATTCTGGTTG
TGACAACATATTCTGCTTGGAGTAAACTAAATAAATCATTTCAAAAGTTA
AGTCGACTGCTATCTATCGGCTATCGCCCATATATCCTAACATTTACTTC
TATATATTAAAAGTAGACTAAAGGTAAAAAGAGCAAGATAAATACCTGTG
AAAACACAGTTTCTGTAATGCCATGGGCTCCTTATCTTCTTCGTTCTCCA
TGTCAGTTTATACTTTCTATTGTCCCTCTGCTCTTTGCCTCAGCTCAAGT
ATTCTCTCCCTACCCTCAATTTCTATTCTGTACAGTACTGGATTGCCTCT
CCGAGATCGGTTTTAGGGGGAACGTTTGCTTCAATATTAGTGTGTATATA
AATTGGATTTACACGACACACCCTTTCTCCCAATGAATTTCCTGAAAAAA
TGTGGCAGGCCGAAACTGTGCATGACCAAAGAGGTTGTAGAGGAGCGTAG
GGCGCTGAAGCAATTGCCGAATGCTGCTCGTCATGACCCAAGTATGTTTT
CTAAGATCGTCATTTGCTGTGTTGTCTACGTGTTAGTGGGGATAGATCAA
CATCAAATTTTTATGTCAGAGTTCTGTTGCCATAGGGCATAAGTTGGCAT
CGATCTGCAAATGGTTTTGTTGAGATGGCTACTTTATGTAAAACAAGGTT
ATCATAGTTTAAGATTCAAATATGATCATAAAGCTCAAAACATATAGTTT
GCTTAAATCCTTCGGATATAAAAATATGCACGTATGCTATTGCTATTATT
GTCCCGTCAGTGAACTGGATCCTACAGCCTTGTGGCAGTCAACTACTTCT
TTGATGGTAGGTGATCTCCTAAAATGATTTCTATTTACACACATTTTATA
TATGTACACACATGCAGGCCATATCAAGCACCTTAAGCATTTCGTGTTCA
TAGCTCTTGCGTCTAAGGACAAGATCAAAGATTTCTTCTTGTCTATCTTC
ACATCTTAGTTGAGTTTTATATTTGACTGCTGGTGTACAGACAAGTCCAC
TTTAATTGAGCTTTGATATTACCATCATATTTATTGGAGAAGGAATATGA
TTCTCTTTTTAAATTAATTTTGTATTGTAATAAATCTGACATACTTGGTT
AAACGGACTTTGGGACTGTATTCTTCATTAAAAAAATTATATATAATTAT
AGATGTATAATTTATCTTAAAATTTATGCAATCAGACAAACCAGATTGTT
GGTTATCTAGCTTATAATGGATACTTTTTGTGAACAAGCAAAGTTTAGCT
GATTTCAACTTCTCGATTTTGAGCATTAATTTGTGATAATTCATCTTGTT
TAGGTTCTTATGTGTCACTGATCAAGAATTCAATCAAGGTTGACGGGTCC
AGAAGAAAGTTCTTCTAAATCTTCTTGTACAAATGCTGCAACAAGGAGTT
TTGTGAGTGATTTTATTCCATGTATAATCGGGGTTAATAGGCAAAAAGAT
CACTGAACTCATGGTCAACTTGTAATTAGGTCACTAAACTCAAAAAGCTT
GCAAATGGATCATATAACTAGAATTAACTTGCAGTCAACTCACTGAACTA
ATAAAAACTTGCATTTAGGTCACTACGCCGTCAAATTCAGTTGACTTTAA
CGGAATCCGTTAAAAAAATTTAAAAACTTTGAAAAAAAGAAAATTGATTT
TTTTAAAAAAAAAATTTCAAAAAACTTATAAATTTCTGAAAATATTGAAA
AAACTTTAAAAAATATGTAATTTTTAAAATAATATGAAAAAATGTAACAA
CTTCGGAAAAATCTAAAAAATTTTAATATTTAAAATTTTGAAAAATCTGG
AAATTTGGGAAAAACTCTGAAATTTTTTTAGTTTCATAATTGTAAGTATA
ATTTTTGAACTTCCAGATTTTTTCGATTTTTTAATTTTTTTTCAAAATAT
ATAGATTTTTTTTGAAGTTTTAAATTCTTTTCATATTAGTTAAAAAAATT
TATATTTTTTCCACATTTTTTATTAATTTTTTAATGGATACCGTTAAAGT
CAACTGATACTTAACGGCGCAGTGACCTAAATGCAAGTTTTTATTAGCTC
AGTGAGTTGACTGCAAGTTAAATCCAGTTCAATGATTCATTTGCAAGCTT
TTTGAGTTTTGTGACCCAATTGCAAGTTGGCTGTGAGTTAAGTGATATTT
TTGCCTATTAACCCACTCTATTATTTCTCAATTATCTGCTACTTACAATC
CTTCCACTCTTCTTACATTACACTTGTTCAAATGTCACTAACCCTGTCAA
ATATTGCAACCATTTAAGAGAGTCGATGAACTGATCACATTCGCGGGTAA
GCTGAAATTAGCATAATATACCTTTGTATCTAACATTATGGCTACAACCT
TGCCTTCAAACTGAGCATTGTACTCTTTAACAAGATCAATGGTTTTCTGA
TGAGAAGCATGATCACTGTGGGACATATTTTGACGAGCAACATTTATTCT
AGTTTCAGCGAGCTTCCGTATCATTTCACACGAACTTGAAGAAGGACTAA
TTTTGCATACTAATGAGGCTTGTGGTTACTGTCATGCTAAGGTCTGGCCT
CATGAATATACTGACCGCTATACAGGAGCCAAACCAAAAGGGTACTCAAT
CTATTGTGGGAAGGGGAAAATTCAACTGTGACTTTTGGAAGCTGCTCCTC
TTGAATTAAACAACCTCCTAACAACTTGTGGAGAGCTTAACAGAATGTTT
GAGAAGAAGAAACTTAACTACAATAATTTTTCTATTTCACATCATTCAGA
GGGAAGATTGATCGATCTTTGAATAATGGTTCTGGTCCTTTGGTTTCAAG
AGCATACTCTGGCTATCAACTCACCCTCGCCCAAAGTGTGGAGCACATGT
CAAAAAAACAAAAGCTAAATTGAGTTTCTTCGACACCCCACTAAATATCA
TACTGCAAAATTAAGAGGCATCAAAACTTAGCTCTATCAAACAATATTAA
ACCACATTAGTATATGTATTAGATCATCTATTATTCACCTGTTATGTCTG
TTTTGCCCATACACCTGTTTCCTTCGCATGCACATTTTACATTATTACAA
ATTCTACGCGGTCCTGTTTACTTAGAAATTCGGTCTTTAATACATCCTTG
TATGCCACAACTTATAAATGCATCTTGCCTATTCAAAGGGTGTAAAATAA
ACACAGAACAAATTTTTATTAGTTATCTTGCACGGCTACTTAGCTAAGAA
AAAGATAAGAAGTCTTCCTCAAAACATGGACACATGTCATTTAAAGGGAA
AATTATCAAAACTATATCCACTCATAAGTTCATAAACTGAAAAAGAACAC
ATCGACCCAACATTATTATTCACAGAGACACACGAATTTATACAGCAGTA
CGTGCCCATGCCTCGGACGGGATTCCACGCTAATATATCATTTTTTTAAA
TATATTCACATAAAATGATTCATCTTTAAATTCGATTTGCACCGGATCCT
TTGAAGTTATAAGTGTGACAATCATATAGAGTTGTAACATAAGAATGTGT
TTCCGTATTTGATTAATTTGACAACTTCTTAATATTTACATTTTTTAAGT
TACAAAACTAGTATATATTCACTTTTTCACGGAGTTCTAATTTATCTTAA
AAATGAATCTTAAGATAATTTTTTTTAGAAACCAAGATTAAAAATAGTTT
TTTTTTTAAAATTCTACAAATATATTTTTTAAAATTTTACGAACATATAT
TAAATGATCAGTCAAATATAAATAGAAAAAGCTAATTTAAGAAAATGATT
TCGTGTAGAGTAATTGGGCGCTTAGGATTAAGATGAAATATATTTCTCCC
AATACAACTTGTTTCTTCCCCTCTCTTCTCCCCTTCGTCGTCGTTTACCG
ATAAAAAGCCCAAGCTACCAAACACACAGATTGAAATTTATACATACAAA
ACATCATCACTGTAGACTACACACACACAAACACCTTATATAAACACACA
CACATTCTCAGCGATCGAGATCTTCGTTGACCGTATCGAGCTTCGACAGC
TACTCTTTTATGTTCACTCGCTAATCATCTCTCCTTGTTTTCTTCGTAAA
GGTACGATCTTTATGCGTTTTTCAACTTTTTCACCGTTTAATTTTATATT
TATGTGTTTGTATCTGTAATTAAGCTCGATTTAGTGAGGCTTTTTATTTT
CACTGATTAGTTGGTTGAAAATTAGGGCTTTTGTTGTTGACTGTTGTTTT
GGTATGATTGGGAGTAGGTTGAATTGTTTGTGGTTTAATTTGCGGTGTGC
TTAGGGTTTTAGGTATGCACCGAGTGGGAAGTTCCGGGAACACGTCGAAT
TCGGTTCGTCCGCGGAAAGAGAAGAGGCTGACTTATGTGTTGAGCGATGC
GGATGATACTAAGGTTGGTTGTGTTTTGGTTTTCGGTGCTTACTTTTACT
TCTTTGCGTTTGAATGTGAATGCCAGGCTTATTTGAGTTTTAAAATCTTT
TGGCAAGTCATCATTGGTTTACCTGTTTAATTTTGTGTAGTGGTGTTGGT
TTTGTTGAGCATTTTTGAGTGTACACCAAAAGTGGTTTTCCTATGTATGT
ATGTGAGGGCTTCGTAGTTATCGATTCTATCGTACATGTAAACTGAAAAG
GGGGCATGACGTATGCATTTTTTAACCTTATCATTTTAGTGGTACTGATA
AGAGGATAGCTGCGGATTAGTTTACGTATATGAGCAGTGTGGATATAAAG
AAGCAAATAACTGAAATATAAAATACTAATTAATAGCCATAAAATAAATT
GTGAGACTCCCACAGAATATGTGTAACTGATAAAGTCATCTAAGGTGGGC
CCGAATGCTCGATCCGCATTCCTTTTTATAAACCATGTTTTTCAAAATAT
AAATCTCATTTTTTTAGTCCATTACCTTCCTTGAAACTTAGATGCCGTGC
AAAACCTATATTTAATCCAGTCACTTAAGTTTCTGAAATTGTTTCTTTAA
TCACCAAACTTTATAGCAGATTAAGATGTTTAAATATTCTTGTCTTAAGA
GATTAACCTTTAAAGAGGTGGGAAAAAATTTATTGCTCATTTCAGATAGT
AATCATTAAGAAACAGTAGACAAAAAAAGTTATCGCAAACTTGATCTTAT
TTTAGATCTTACTTGTCCATTTTACAAACCAATGCATACTTCTACTACCA
AATTCGACAAAGTCGAGTCAGTTCATTAAAATCTAGGAAGAAATCGTGCC
AATATTGTCAGAGATACTAAACCACCACATGACCTCATAAAATCTAGGAG
GATATTTGGGATCGTTAATGCCAAACCACATTTAAAAACATTAGTAATTT
AATTGGTTTTCCTCTGGTGTCTACTAGACTATATGTTCATTATTCCTGAT
ATTAATCAATATTGTTTTGAGCAACAGATTTTTGGTAAACTATGTAAAAT
TGCTTACTGGAAAAGCTTTGACAGATAATTTGACACTTCATATTATGCAA
TTTGAACTCGGTACGTGGATGATGTTTTATGCTATCTTTTGCTCTTTTAT
CCAACTTGTAAAATATTTGCACTTCGGCGCTCGACGAAATTGCATCAGAC
CATATTAAACTTGTTACTAGTTCTTTCATGGCAAAAAAGTATAGAACACA
GCACTATATTACTATGTTTAAAAATAGTTTTTTCAACAATACCTATATAA
AAGAGGAATCAATATATGATTTTTATCATGTCCTTGCCATGTTTTATATG
TATCTCTGTAATTACAATCTCAAATTACAGAATTTGTGACATGCACAGAC
AACTAAAAGAATTAAAATCTATTTATGTCTAACCTATCTCCTGGCAGTTT
ATCTCTGTATTATGACCAAAAAATTTCTGATTGTTTCAGTAATATTTTCT
TAACACTTAACAGCTTGTTATATTTTTTGAATGTTTGTCTTTGTTTGCAG
CATTGTGCGGGTATAAATTGCTTGGCTTTATTGAAGTCACCCGTACCTGA
TGGGCACGACTCCCTCTTCACTGGGAGCCGTGATGGCACCTTAAAGAGAT
GGACAATAGCTGATAATAATGCTACCTTCTCGACTACCTTTGAGTCTCAT
ATAGACTGGGTATTGCAATTCTGAATCTTGATGAAGGCTGTATAACGTTA
TCTCCTATGTTATTTGACTGCGTCTTATGAGAGTAATTACTGTATCTGCT
ATCAAAAGAACTTTTTAAATTATCTAGGTCCTAATTAGGCGAATTAAGCA
TTAAGCTAAATATAGGCATACATATATATTAGATATTCTATATATATAAT
TTGATTGTTTCCATTAACAATTATACTAATGTAGATTAGATCATTTTGAT
TGAATTAAAGATTTGATCAACTTCTGTTTGTTTATTTTTAAGACTGTCAC
AATGAAATTTTACCACTCGGATTAAATAAGCCAAGTCAAATTATATATTA
GATAAGTGTTCGATATGTATTGTTGAACTCCCAACTTCCTAGACGTTGCC
TACTTAATTCGCCTACCCTTTTAAGAATTAAGTTAATCTGGACACTTATC
CATTTTTGACCCCCTTTCCGCCTATGCAGCGACTTCACAACTATGGTTAA
TATATATATATGTATGTACGTACGTATGTATGTATGTATGTATGTGTAAA
CACGTAAACACATAATGGGGCGTTTATTAAATTTGTTATTATTATTGATA
ACAAATTATAGATTTAGCTACAGGACATGTATTCCTTGCCAGATACATGA
ACACAATATTTGAATGTCCTTCCATTTACTGAAAAAGTCTCATCCTTTTG
TGGAACTACAGGTCAATGATGCTGTCCTTGCAGGTGGTAATACACTAGTT
TCCTGCTCATCGGACACCACAGTCAAGGTCTATATAGAACTCTGTCTTTG
TCTATATTAAAATCTTCAGTACTTCATCTATTAATAATATTTGGACTCCC
ATTTATCTGTACCAGACATGGAATTCTTTGTCAAATGGAACTTGCACCAG
GACTCTTCGTCAACATTCTGATTATGTTACATGCCTTGCTGCAGCAGAAA
GAAATGTAAACTCTCTCAATTTTTTTGTGCTCACCAAATGCAGGGATTGT
GTTTTCCTATCAGTCTAATCTTGCAAAATAATTTTCTAGTCGTTAATGCA
AGATGAAGTAAAATATATTTCGGAACATTTAATTATTGGATTATTTCATC
TTTGTAGGGGAACATTGTTGCCTCCGGTGGGCTTGGTGGTGAGGTCTTCA
TATGGGATGTTGAAGCTGCCCTTTCTCCTGTCACCAAGTCTAGTGATACC
GCGGAAGACGATTGTTCAAATGGTAACGGTGCCGGAAATTCACAACCGAC
TACTAGTCTAAGGACTGTCGGATCAAGTAATAGCATTTCCTTGCACACAA
CACAGTCACAAGGATATGTGCCTATTACTGCTAAAGGCCATAAAGAATCA
GTTTATGCATTGGCAATGAATGATACCGGTAGCCTTCTTGTTTCTGGTGG
AACAGAGAAGGTATATCCAAATCTTATAGAAGTCTTTATTATTTGCTTTA
CAAGTTTGCTGCTAAATTCCTCCTTGCTGGTTTGTGGGTTTTTATAATTT
ATATTGAGAGATTTAGCGTATCTATTGGTTTTGATGTTTCGTCCTTCGTG
ATGTCATTACATGGATATGACTTTAAAAGATTGATACTAGGATGTCGTTA
CATGGATCATATATGACTTTAAAAATTATATGTTTTCTTTTAGGTTGTGC
GTGTTTGGGACCCCAGAAACGGTTCAAAGACCATGAAGCTGAAAGGGCAT
ACAGATAATATTAGGGCATTGCTTTTGGATTCTACTGGCAGGTTTGTTGC
ACTGTTAAAATTTACCAGACCATAATTTTCTTGATGTTTTAAATATGGAC
TTAGCTGATTGAACTTTGTTTAATTAATTTCTGAAGTTACGGCGAAGTAG
TGGCATTGTGACACGCTATAATAGGTGAAATTAAGTTTTCTGTTATTTTA
TGTGTTCTATTTACGAGTTCAACGTGAACACTTCTAGAAATCAATCTATT
ATACAGAAATAGTTAGAAAACGTATACTACGAATTAAAAGATTATTTTCA
TTAGACACTTATGTTGTTGTTTCTGATGCTGCTGATGTTATTGTTAGCTT
GCGTTAGTAATTGCAATCATATATTGTCCAATCAATTTAAGAATTTAAGG
GATTGTAAAAAATTGAACTGTTAACAGCTCTACTATTTATCTGGAAAGAG
GATGATGAAACTAGAAATATTAAAAGATTGAAAATGGTTGCAAAGTGTTA
AGGAACATGAGTGTCATAACAACTGGACGATTAAAGAGATAAAACATAAA
CAATTGAAGGAGACGTTGTATACGCAACTAACTTAGATTGTTTGTTTTTT
TTATGGAGATTTAGTGTACTAAAAGCTATCGAAGTAATAGATATTTTAAC
AGTTCTGATGGTATGACGGTGGTTAACTTTTTAATGATTTGAGCAAACTC
TACAAGTTGGTAACTGTTCTACTACTTTCTCTATGCAGGCTCTGCTTATC
AGGATCATCAGATTCAATGATCAGGTAAATGACTAATGTTATCATTAGCC
GCATAACTGTCAAAATTTCAATTTTATGGGTATTTAGCTTGGTTCCTTCT
ATTTTTCAGAAAGCTTCTTCAGATTTTAACCTTACACCATTAGGTACACA
ATGACTTTGGTATGTCAAGAACTTGTTAGAAATTAAGTAAGAGACGGAAG
GTTTAGTACTACTTCTTCATTGAAGGCAGCTGGGTTTTGTTGCAGTTAAA
TTGTTATAAAGAAAACACGGAGCTTCAAGCATTCACAAAAATATACTCTT
TTATGCATGTCCTTCTCCCTGTCTTTGAATTTGTCACCCCTCTAACCTCT
TCTGCCAGTGAGGATTACTGACAAACAATTGTGCTGCACCACTTAACCTC
CTTCGTGTCACTTATGAACCTTAACCTTAAGTGCTGTTTTGTTACTGCAT
CACTGCCTTTGTTTTGCCATCACTAGCCAGTGTAATAATTAAGTTCAAAG
TTTAATCCAACAATCAAGTGCACCAAAATGTTCATTAACAGATTACTGTC
TTAGATCAAATGTCGATTGAGAAGGGATCCAGCAATAGTCTTAACCCACC
ATCAGCTTCATACTAATTTGATAGGATCACAATCTTGGTACCCTCAGTTG
CATGATGCCAAAATTTTTGGGCTCTATTGAGCATCGCTCTTTTCAGTTTG
TCCGATCCAAAAGATCCAAACATCTCTCTTAAAAGTTGACCCAGATTTCA
TCAATTATCTTTCGGAACTTGTCCAAGACTACCTCTGATTTTGTCTAAAG
TCTTTTGTGAGTTAAAATTTATTATTCAGCTGAGCCATGAAAGAAGGCCA
TGTTCGCACTAAGATATAAACAATTTGGAAGTGAGAGAGGAACTCACTGC
ATATCTGATATATGTTGATTTTGGCCTGCTTTTTATGAGAGCTGATCTAA
TATTAACTTGAGTAGGAAATAAATCTGAAATAGCAACATTGAATAAAATA
TTACTATTACTGTGTTAATAAGTTACTCTTATAGGCTTGCTATATTAGTC
ACTTTATTGTGCTCTATCACTGTAGTAGCCTTTTGCATGCACTACAAACC
AAATAGCCGGGGGCAGGAGTATCTGTTTCATTCTATGTGAGAAAATTACA
TTGTTTCTGGTAAATTTTTGACTTAAAGCCCATTAAGGTGCGACATTTAC
TAAAGAACTTTTGTATAATATTGTATCTACTTATTTTCTTGTTATGTTCT
TACTGGCTTTCAGAAAAGATAATTTGTACATGTGCAGTTGTGATTCTAAG
ATTTGAAAGTTAACATGTGAAAGTTGTCATCTGTAAGTGTTCTACACCAT
TGATGCGGTGCCAAAAATTAAAAGACTAGTTTGTATTTGTGTTTATGTTA
TTATTCAGGTATAAGGATGAATATAATTCCGTTGGAAGTTAAATATGTTA
GTTAAGTATATTATTGGGCTTATTCTAGGTTCTTGGTACAGTAATGTGAT
GGGAGTTATTTTTTTTATTTTATTGTTTGAATCATGGTAGTGGATTAGTA
AAAAAAATCATATATCGAGTACACTCTTATAGTTTTCTTGTTATCAGGAA
TACTTTTAGCGTTTCTATATCTGTACAAGGAGATGTACTCTTATATTTTT
AAAGACTTCAACTGATCATTGAAATTAAGATTCTTCTCGTTATAGCTTGT
TATATGTTCTGATCCAAACACACTCTCCGTCATCCTGCTAAGGATATTCT
TGGGCAGAGGTTCTGTGTTCACATCACCCAAGCCTATTTATCGTCGTTTA
TAATGTAGATCCTTCTTTTTAGTTGTTTTGCTGAATTAACAATTATGTCT
TCATCTGTTTACAGTCATTTAATTGACCAGCTCTTTTGTTTCTATTTTTA
GACTTTGGGACCTTGGCCAGCAGCGTTGCGTGCATTCATATGCTGTGCAT
ACAGATTCAGTTTGGGCACTTGCTAGTACCCCCACTTTCAGTCATGTTTA
TAGTGGTGGCAGAGATCTTTCTGTAAGTGCTGCGGAACTAATGTCTTTCT
TCTTTTGTTTCTTGTATTATATTCTCTCAAAGGTTCTACAAGATATTTAA
ACCAATACTATTTGTATACTCAGTTGTACTTGACAGACTTGTCAACAAGA
GAAAGTATCCTACTTTGCACAAAGGAACATCCCATCTTACAGTTGTCATT
GCATGATGATAGTATATGGGCTGCAACTACAGATTCCTCTGTACATAGAT
GGCCAGCTGAGGTTCACAATCCTCAAAAGGCTTTCCAAAGGGGTGGCTCA
TTCTTGGCTGGAAATCTGTCATTTTCAAGGGCAAGAGCTTCATTAGAAGG
GTCTACTCCTGTGAGTCATACTTAATTAAAATTTTTGCTCATTTACATAC
CTATATCGTCTTTTTAAGTGAAACATTAGTATAATAAGTAAAATTCTATC
TAGAAAAGAAAGTAGTCAGTCCAGAATGTGCTGGGTGAAATCTTATTAAT
AATATCTGAAGATGGATCATCAGAGAATGATGTTAACCAATGTTTCACAT
CGACCTCGAGAGACTACGCATTTACTTCATGACATTAATTTTCTAGTAGA
ACTTATATATCCATTATAAGAACTTCTATCTGTCTTATTTTGTTGTTGCA
ACATTTCTTGTCTCTCTTGCTACTCTCAGCTCCAGAAAGGCGGTACAAAA
TTTTATTTCAATCTCTCTGCAAAATCTTGAGAATCTAGATTGACAGGACT
GGAGTGCGATCTTATATATATATATAAATCTACTCTAACATACTTCTTTC
TACCATATATACTATATTATTAAAGCTGAAATATTGGAAGTATGGTTGAT
TGTTATTTTTGTATGGTTAGTTTAGATCTAACCTTTAGATCTTTTAAAAT
AAACTAAGAGCAAGTCCAAGAGATGCCCTATATCATGTCCTAAGTATTTG
GGGTATTTGATGGAAAAAGTTGCTCCAACAATGTCCTAGTGATGCCTTAT
ATCACCAGGACAAGCTCCTCAAGCCCTATTTTTGAGGTACATCTCTCCTT
GCCCTATTCCATATTTTATTATAAATTCTCATCAACACTCACGCTCTCTT
TACTTTTATATTATGATTTAGTGATGAAAGAGAGTCTTTAATAATAAAAT
ATTAAACATCTTGTGTGAATAAGGCACATTGTTGGAGTTCAAGTTAGTAA
AATATGTCCTAACATACTAGGACATATTTTATATTATATTTAGGGCTTCA
ACTAAGACACTCTTGGACTTGCTCTAATGAGAACATTAGACTAGATCTGA
TACTAAAGAATAGTTTTAAGGTTCGAATCCCATTAGCATGTTCAAATTAA
AAATTTATAATTATCAATTCTGAAGATGCAAATTGAACATGCTAATATAG
TAACTTTTGTTTTAATTAAACATTATAATATATTGTTTACATTAGAATCT
CATTAAAAATCATATATAAAATAAGACATATATACGAAAATAATAAAATA
TTGAAGAAGATCGCTCGGGTGAGGAACTAGTATGATATATATCCCTCAAC
AACTAAATTCAAATGCCTGCCACAACTGCATATCTATACTATACTGTAAC
CGGAACAGGGTATAATTTGTAGTTCGGTTGATCTTTTTTAGTATTTACTG
TTGGATCTCGGGTCTTTTGAAAGCAAATCCATGACATCCGCTAGATTCAA
TATCAATGGATATTTTTTATTTTAAATTCATACCTTCGAAGTTCAGAGGT
TCGATTTTTATCAACATCATACTAAAAGTAAATAATTTACCTGTATGATA
ATACTTTACTATTTAATTATACTTTCATCAGAATTATCTTTTTGTAGTTA
CAAAAAACTTTGTTAATATATTAAAGGATGCCCGTGCATTGCACAGGTTG
TAACCTAGATATTTAAATGGTAGAAGTGCTTTATCCTGACCCTTTTTTAA
AAACAAAAGAATGATAATATTGTAGGTTCCTGTATATAGAGAACCATCGC
TTAGCATACCTGGGACTCGAGGAATCGTGCAACATGAAATTTTGAACAAC
AGAAGGCATGTTCTCACTAAGGTAAGGTGGCAGCACTAGTCTTGTTAAAT
TTTTAGTTCTGTAATAGAACTGTCCTCTCTGTTATTAGTTCTTCTAGTGT
TTATCTAGGTCTATGTAATTCAGCTTTGGCCTGCAATGTTTCTGTAGGAT
ACTGTTGGTTCAGTGAAGCTGTGGGAAATTACCAGAGGGGTTGTCATTGA
AGACTACGGAGAGGTTTTTACTATGTCTTTACTTGATATTGTCCAGTGTA
TGGAGAAATGTTTTTTTAATATGATATATTCTTTTTCACAAGATTGTGTT
CTACAAATATTACCTTATTTTATTTCTCTGATTATATATATCTATATCTA
TCTTTATAGATATATATTCCAGGTGTCTAATTTTTAAATGCCTAATATAT
ATTTAATATATCTATTTCAGGTTTCTTTTGAGAAGAAGAAGGAAGATCTT
TTTGAAATGGTGAGAAGTGGTTGTAAAGTTAAAGTGTTTTAAACTCTGTC
GAACAAATTTCCAGATTTTATTTACTTTTTCCTTTCAGGTAAGTATTCCT
GCATGGTTCACTGTGGATACCAGGCTTGGGAGCTTGTCTATACATTTGGA
TACCCCACAATGCTTCTCTGCTGAGATGTATTCTGCAGATCTTAATATTG
TCGGGAAACCTGAGGATGACAAGGTACACCTGCTAATATGGTCCCTACCT
TTTCCACATTTTCCTGTTGGACATTAAATTTGACATTCAGGATGTCTGTG
TCTACCACTTCTAAGTATTTGATATTTTAATCCAGATAATATTTACCCTA
TTATTTGTTTGATTATATATAATGTCAAGCGAGGAAATATTCGTTTGTAG
GCCTTTCGCTTTGTACTTCTGTTTCCACGTCACTATGAACTTAAGAGGGC
ACTTTTCATCACCATGATGACATTCCTAATATTGTTTTCAGAAGTTTCTA
AGATAGTTCTGGAATAAAATGTCTACATCACACATAACAACAATCTGCTA
GGTGTTAGAGAGTAGTATAATCTTTGCCAAATCACATAATGTTCCATGCA
GAGCTTTACTGTTTGGTATCTGTTTTCAGCTGCTTTAAATTTGCTTTTAC
GTGTAAATTTGATTGTGTGCAAGGCATCCTCATATCATGTAAGATTTTTT
TTCCTGCAAATTCATGATATTGTGGTTTCTCATTCTGTTGACAAACACAT
CAGATCAATTTAGCTCGGGAAACCCTTAAAGGTCTGCTAGCTCATTGGTT
GAGCAAAAGAAGGAACAGATTTGGAACCAAGGCCTTGGCAAACGGTGATG
TTCCTACTGGTAAGGAGATTACTTCAAGGAGCATCACCCTTTCGAAAGTC
GAGGTAGATGGCAACAGTGAAAACGACTCTTTGGTGTATCCTCCATTTGA
ATTCTTAGCATCTTCATCTCCCTCTATTATTACCGAGGGCTCCCAAGGTG
GCCCATGGAGGAAAAAGATTACAGATCTGGATGGCACAGAAGACGAAAAG
GACTTCCCCTGGTGGGTTTTAGACTGTGTATTAAATAACCGTCTGCCTCC
CAGGGAAAACACCAAGTAACTTCTGATCTTTATTCATTTTCTTTACCTCA
GTGACCTTTAGATAAATATAGCATGACATTATGAACTACACTTTATTATA
TCAGGAATGCTACATATATAATGACTTGACAAGCTAATCAATAATAATGA
CTGCTGTAGATATAAAATACATATAAAATGTGATTCTACTATAGAATACC
ACGACTTATATATTATAAAATTTAACACTTATAATATGAACAAAAAATTT
GTTTTTCGAAACTGGTTCTACGGTAGATTAATTCTGGTTCTACGGTAGAA
TGATTCTAGATAATTATTATTCTCCTGTAGAATCATGTTGGAATACTGTA
TAATTTTCAATGATTTTTGGAGTAAAATAATTGTATTTCTTTTTCGATTT
ACTAATTAAGATTTGTAATTAAATTTCACAAAAAATATAATAAATATATG
TATTATATATATATTTATAGTGGTGTACTACGGAACTCCATATAAGAGGG
TATGCTACGGAGTGCTACCCATATGCGTGTGTGTGTGTCTATACTTGTAT
CATTGTCTGTTCTGTGCTCTTTGAATATATTTGCAGTTTCTCTTTAGTTA
CCATTTTGATGCTGGTATTTATAACTTATTAGTATGTGGTGCTTTTCAAT
TTAATTATCATTGGGGAATATCATTATAACTAATATGTGATTTATATATA
ATTTTTACATTTTAACAGTACATCGCGTTCAGTTTTAATACTGAGTACTT
TTTGTGCTACGCCAGTTATATATGGCCGCGGTAATTTTTTAGCTCATAGC
ATTTTTAAGGCGTGTCCTTAATTCCTATTGCTCAACTTCAACAGATGCAG
CTTCTATCTACAACCTTTGGAAGGTTCAGCTGCCCAGATGCTTACACAAG
GGAAACTGAGTGCGCCTCGCATATTGAGAGTACACAAAGTGAGTGTTTAT
TGAGTTGGACTTGAATACATCGCAAACAGTAGGAGGTCGTTCCCATAACC
TTTTAGTTACGGAGAATACTACCATTAGCTGATCTTGACAAATCTTTCAA
ATCATTATATTATCAAGTCATAGTGGTCGGGTGTTGATATGTGGGCTACC
TTTATAGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGAATGTATATAGGG
AAGTTGCATGTCCGTTTTTACAACCTAGTATTTATCAAATGATACAGCTT
GAAAAGAAGTGAAACAACAAATACTTTGAACCTTTATGTGGACAAAAAAT
TGCTCAACAATGACATGGAAACCTGTAAAGTTTCATAGCTGTTTTTGTTG
GGGTTCAGTGTGTTAGTTGGACGTCTGCTTCTGAATCAACAGCAGGCGAT
AATGGATATTCACGTCTTAATGTCTTGCCCCAATTTATGTTGTAGGTTGT
TAATTACGTGGTTGAAAAGATGGTACTCGACCAACCGTTGGATATTGTAA
ACCCCGAAGGAGCTAAATCTTCTGGATTACCCGGAGGACAGATACAGCAT
ACATCTTCAGGAGGAGATGCTTCTTTTCGATCTGGTTTAAAACCCTGGCA
GAAGCTGAAGCCTTCTATAGAGATCTTGTGCAATAATCAGGTAGTTAGTG
ACACAAGACATGGTAGTTAATATTTGTCTCAATGTCCAAGCAGCAATATT
TCGTGCAATGATCACTCAATTGTTATTTTCCTTATGCTTAAGTTTTGTAC
TATCGGTTATGCATGGATGCACTCTTTATTGTTCTCGGTCAACCTAGAAA
CAGTTTTATAAGTGATGGTTGTACATAAAGTATGCTTTATGTGTAGCTAT
TCGTCCAATGTATGTGAGGTTTATATCACTAGGTGATTTTTTAGTGAATT
GGATGTGAGCTGCATGATAGGCTCAAATTTGTTTAGGTTAGGAAAACATT
TTGTATATCACTCTGTCAGCTTTGTCATTTTACGAGTGGGATGTAATCAA
ACCAAATTGATTGCTCTCGGAACCTTACCGAACCAAACAGAACTAAATCG
AACCATGCGTGGTATTGCCCATGCTTGGTATTACCCATGCTTAACTGTTG
GAATATACTCGAACTTAGTTCAAGCTCACGATACTATATCCACAAGCTGT
TTGTTGAAGAAATTTTATGTTTTAGAGCAGCTTGTGTGTATTGTTTCACT
CATAAATTTTGTAAACCATTAGCTCATAGATCTTAATAAGGAGTTGAAAA
TTGCTTAATGAAGACCTGGTAAGAACTAAGAAACTCTAAGTGGTGTTTTT
CACATCATTAATTTGTTTCATATCTATCATGTTTATACTTAATCAGATCA
GTTTAGGCATTATTGACGAAATCAAGTCAATCACAGTTTCTTGACGCAAA
ACCTTACTGTAATGTTTTTAATTTTTGTGTTTATTATGAAAGGTGTTGGG
TCCTTTTCTAATTAAATATATATTTATCAAGTAAGAATTGTATGCCTTAA
TGGTAAATATGGACTCTCTCTAATGGCATAACTAATTTTCTTGCTTGTCA
TGATTCTTGCATCTCCAAAAATTGAACATCTTTCTTTTCAGGTCTTGTCT
CCTGAGATGAGCTTGGCTACCGTTCGAACCTATATATGGAAGAAGTCTGA
TGATCTTGTGCTGAACTACAGAATAAAGCAGGGAAGATAACTCTCATAGA
GTTGGGAAGGTGTGTAAAATTTAGTGCTGATTAGATATTTTGTTATAATT
TCTAGTTGGTTCACATTAGGAAGGTAGTTCTTGTTCTAACATACGATTAT
AATACATAGCATTTATCCTCTTTATTTGCCAAGTTGTTGAACATCTTTGA
GTAGTAATTTGTGCAGTACTGGAACTGAAAATTAATGGTGTTGTATGAGT
TAGTAAAGTGTAAATGTGTTCGTCTATAATTTATGCTTTTGTATAATATG
ATTTCTGTTATTATATTGAATTTCTTACTAATATTATAATCAACTTGTTC
TTGTTGCTTTTTTCGTCATGGGTCTAACAACTGAGTTATAATTTTTTTTA
ATAACATTTCTCGTGTATCAACTAATTTTTTGCAGGGCTGAGCTACCTTG
CAAGATTTTTGGGAGTGATCCATTTTTCTGAGGTGCTTCTCATGATAAAA
AGTACTTGATGCGTTGCTTGTATATCTGGCTGACAAGTTGGTTACTAGAT
CTAGCAGCACTAGAGGTGCTGGTCAGCAGTTGCCTAGTTAAAGATGAAAA
GAATTGCATGTTGAAGTTTGGTGCTGACATGCTAGCTCTTTTTATACATG
TGTGGAGTGAGTTGCATCAGTTGATCAAAGTAAGGAATGTTAACAGAGGA
GTAAGAGGGATACTTTTTAGATGAGCCAAATTGGCGAGATATGATGTCGA
CAAGCTTTGTAGATTTGTATTATCGGGCTACTCTTCCTGTAAAATTGATG
TGTTATTTATTAGATAATTATATTTTTCTGCAAATAAAACAGTTTCGGCC
CTCCAAATATTTTCTCCCTCTTTCTATCTTGTTTCTTTAGGAGTTTTTCT
TTCCATTGCTTGATACGTATTTTTAAGGCTCATATAAGACATGGTTTCAT
AACTTATTTTAAAAAATTTATACATCAAACTCTTTTCAAAAGAAAAAAGT
TCAAAATAATTATCAAATTGTACTGTATGAGAGCATTAAAATACAGGAAA
AGTTACAAATATATTAATTTGGATTTGATTTTTTTTATATATTAATTTAG
ATTTGATTTTTTTTACATGTATTTTTAGGAAGTTTGACCATATATTTAAA
ATTGGTAGCTTAAAATTTTTTCTTCTGAATAAAATATTTATATTATATTT
TTATTTAGCTAAACAAATTATAAAAAATATTAATTTTTATTATATCGTCA
AAGCACTTATAAATAGGTATACAAATTTAAAAATTGTCAAAAACATATAT
AAAATATATTGTATTTCTGTAGTTGTACTTATGTTTTAAGATTTATATTC
TGTTTCTAAATTTTTTTTGAAATGAAATCCGTGCAACGTAATGCATGGAA
TGATTTAATATGTAGGGAAAATTTAGCAAATATACTGTGTTTGTAAGAAA
AATTATAATTTTACTATTTTTTAACATAATTACGAATATATTGTGTAACT
GAATGTAACCAAATGCATTTTTCATATTTTTATAAAAATATATTAGGTAT
ATAAACAACGGGATGCAAGACAAACAAAAAAGACATATACGATACTTAAT
AATGTACCTTGAGGGTGGAAGGTAAAAAAAAAGATGATAGACTGTGTTTG
GGAAAAGAAGAGAAGCCGGAGCTGATGTTAAATTTGATGAAAAGCCTTCT
CTCTCTAATTTGATAGAATTTCTTAACTTTTCGACTACGGTAAAGTTGCA
TTTAGCTACTAGTCCTAACTCTCTAGGTGTACTTATTTTTCCACCTTTAT
AACCACTTACAACTTATTATGTAATGAAATATATTTTTTCAAATTATATT
TGTAGTTCCAGATGCTAGTAGTTGGTAATTAAATGTATTTTTTAAAATTA
TAATTGTGGTTGCAGATATTATTGCTAGTAGTTGAAGATACAATTGCAAA
TGTAACCTCCGTGATTTTGCAAATTTTTTTTGGGGAAATGATATTTTGCA
ATTTTTATTGTATTTTCGCAATTTTATTTAAAAAATTACAGTATCATGGT
TTTTCTTTGTTTTTCCATTTATAAGAATGAGAATACTATTTATTTTGTAT
CTATAAATTCTTGTTTGTATTAATAAGATTCACACTAATTCACATATTGT
GCTTTTCTTATTAGATATCCGCAATACATATGCATATATTTTGGACGGAA
ATCATATGCAATCATAAATAAAATCTACTCCCTCCGTTTCATAATACATG
TTCACTTTTGAACAAATCACATATATTAAGAAAAATTAACTTTTGTAAAA
AACCTTCATTTATTATTGTATTTATTGCATTAACCAAGTATAATATGTGA
GATATATTTGATCTAGGAAATATAATTTAATAATTAATAGGATGTGGTAT
AAACTTCATCTAGGAGATACAACTATTGACTACATTGCATTTAAAGTTGA
AATGAGATAACTAATTTGAAACAATTTTTAGTTATCAAAAGTGGACATGT
AATGAAACAGAGGGAGTAATTGTTTTGGAACAATCAATCACCGGCTAGTT
GCATGTGCTCTAGTATTAATTTTTACCGGAAAACACATGAGCTGCTAGGC
CCGCTCTTCCTCATTCGAATTCAAATTCAAAATAAGTGTCTGTATATATC
ACTGCCAACACCCTATTTCCCTCTCTTTATAAACCCTCAACCCCCCACTA
ATTCACACACACAAAAATATTTAGAATTTTAATTAAATAAAAGGGGTCAG
AGCTGATAATAATTCAGGCTTTGGAGACAATTCTTTGTTGTTACCTACAT
TCAAAGGTTTGGCCTTTTAAGTCATTAGTCTATGATTGATTGCTTTCTTG
AATTTCGTACATTTCTTGGATTCTTGAATTTGTTTTGGCAGTTGATGAAG
AGGGGTTCTGTTGATGATGATGAAAGATTAAAACTTGGGCTTAAAAGACC
CAAAATGAAAGATCTTCATTCTGTGTTTACTTCCCAAAGTGAAGGTAATT
GCTTCCTTTCTTGTAAGGTTCAATTGTCCAAATGCGTTGCTAAATGTTTG
GCCATGCTTTGATATATATTAAGGTTTGATGATTACAAATTTAATTTACA
TTGGGACGTGTAAAGTTTGGATTTTGAGTAGCTTTTATAAACGTTAGTGT
GGGAGTGGGTCTAAAATGTATTGAAATTTGATTAAAAAAATAATTTATGT
ATCGAGTTATATCATTTTAAGGATTTTAAAAAAGAATGTAGATGTAGATA
TGGGAGTTGGGTTTTTGGTTGACACACCCTGATTGCAATAATTTTTCCAA
TTGAGTCTTGAGTGTTTATTTCGTTTATGAATAAATTTCTCTCTTTTTAA
GAATGCCTATTTTTTTGGGGTATGTATGTGTTCTGGACTGTGATTCAGTG
TAAAATACATGTGGTTTATATGCTTAGTTTGTGTGTGTTAAGTTTGCGAT
CAATGGAACAGGGATTGTCCCACATTATACAAAATATTGGATGAAAGGAC
ATGCTGCTGATAGTTACTATGCTGCTCAGAAAGAAATGTTTCGAGCCAAA
AGAGAAGCTATTACCATGAATTCTGATGTTACTCAATCAGTAGAAAGGAA
GAAGGGCGCTGCCTGTACAGCACTTGATCTAAATGCCACAGTTGATTTGA
CCAAAGACAGGACTCCAGCGTGTGCTTATAACAACAACAATCTGACCTCT
AGTTCTAATATCAAGATCGACAAGTTAAAAGGCTTTGGCTTTGATCTCAA
TGTGGAAGATGTTTCAAGTTCTGCTGATTATGACCTAGTCTGTCCTAATA
AACATATTAAGCAATTAAAACTAAGAGATGATTCGGAGTGTGAGAGTACG
TGTAATCCAGTGGAAGATAAAGATCCAATGAAAGTATGGAAAGAGATGAA
GCAAAATGGTTTCATGTCATCTTCCCATGGAGGTATACCAATTCCAAAAC
CACGTGGGAGGAAAAGTAAAGCTGACGGTCTCAAAAAAAAGATGGAAATT
GCCAGGAGGGAACAGGTTGATAGGTTTGCAAAGATTGCTGCTCCTAGTGG
ACTGCTCAATGGATTGAATCCTGGGATTATTAACCATGTAAGAAACAGCA
AGCAGGTTCATTCTATAATTGAGGCTCTAGTAAGGTCTGAAAGACGTCAC
AATTTCCATACTGGAAACAACAAAGAGAAAATTCAGATGAAGACAGAAAG
AATAGAATCAAGTGATAACCGAAGAAACCTGAACTTGTCAGGAATTGAAG
GATATAATCTTTGTCAAGAAGATTGTCTGCTAAATAATGCATTAACAATC
AGACAGACAAGTCACTTCCCAGTACGAGACAACAATGCCTCAAGCTTGGT
ACTGAACAACATTTCTAATTAAAGTAATTGTTCCTTATAATTCAATCCAA
TATATCAGGATATAAAACTTGCCCTAAAATCTTAATTATCTGAAACTATT
GCATTGCAGGATACCAGCACTTTGTGTGATCAAGACTCGACAGACTTATC
AAGCGTTTCTTCTTTATCTTTCAAAGGTCTCTCTATACCATTTAACTCTA
AAATTGTGTATATATTGGTACTAAATTTGTATCGTTTGACTTGAATGAAT
ATGTCAAAAAAATGCAAGTTAGTCTTACATTTTAAGATCATAATTAGAAT
ATAGTATTTAGAAGTGATTGAAGTAGCATGTGAATAATTAATGACAAATT
GGAGGTGTTTGACTGTCAAGTTGAGCAGTTGAATCAATTAACTGATTCTG
CAGACTGCAGCATTTTCATTTTTTTAGCATAAGTTGTTAACTCCAAGTCC
ATGAAACCAGCACGAGTAATAAATTTTTCACTACTCTCCCTGGGATTCAC
AACATAGTGTAATGTGAGTCGATGGCCAACATTGATCTGAGTTGATGGCC
AACATTGATGTTTAATGGATAAAAATAAAGACCACTTTCACAAGGATAAG
ATACACCCAACTATCAATGATTATTGAGAACCTTTAGATTGCTTATGTCT
TTAATAACCAATGATTTTAATATAGATTGATCACGACACAACTTTTATAA
AAGTTGAGAGATTCCCGACATTATTGTATATTGCATGAAATAAAGGTTAA
CTTGTAAGCTAATATATGATTTTTGTATCCACAGCTGCTAATGTAGCTTC
CCAGTGGCTAGATCTTCTTCAACATGACATAAATGGTCGCCTTGGAGGTA
TGCTCAGCATGAAATCTTGTACTTTATTAAAGATATAAATAAAAAATTTA
TCATGTCAACCTTGTATTATATGCTGTAATTATTTCTTGCAGCACTACGA
CGCAGTAAGAAAAGAGTTCGATCTGTTATTCAAACGGAGCTCCCTCTTCT
TATATCTGGAGAATTTTCTCATAATCAGGAGAATGATACTTATGTTAGGA
AGATTCCCTTCTCTACTTCATCAGTGAATGCAACAGCAAACATGCACAAA
GCTAAATGGAACGTGCTGTTTAATCAGATGGAAAATGCACTTTTGAGTGA
AGAGAGGCAACTGGTATGTCCTTCAGAACCAGGGGCGGATCTAGGAATAT
TTTGTTAGGGGGCACCAAGCAAATTTTCGAAAAACACTTATATATTTTTA
GTTTTTAAGGGGGGCACTTATATAATTTTGTAAAATTTAGAATGGTGAAA
AAACGTCAAAAATTCTTTTAGGGGGGCGGGGCACGTATCTCCCCATGCCT
CTTACTAGATCCGCCCCTGTTCAGAACTTTACTGTCTCCCTAAATTTATA
TACATATCTGTTCAGAAAGATCTATTAAAAATAATCCTAGTTTAATCAGC
AATGTCATCTGAGACATGTAAAGAAATGGAACTTGGGCACCATTACTGTA
ATATATTACTCAGCTTCTTAAGTGAAGTCATTATCACTTATAATTTTGCA
GTATATTGAGATATAATAAACCAAATTCATCCTATCAATACTTATAGATC
TTTTGCTATATTTATTTTATTTCCATATGCAACTCATAATTGTTATATCA
ATGCGCCTAAAGACAGGGTCATTAACTTTTGAGTTCTGATGCTTCATTTA
TCGTCCTTTGCCTAGTCCATTCTAATACATTCTTGTGTTCTCTGCCCAAT
ATTATAGGTCTTAAATCTTCTTTTCTATTTAAGTAATTCTTTCTGTGGTC
CTGCACTTATCTTCAAGAAGTGTTTACTACCTAGTTATACAGTTTGCAGA
CATTGTTTGGAAACTAACTACTGTTGCTTAAGTAGTTCAATTCGTCTCAC
TTTTTATCATGGATGGGGAACCCTAAGTAGTTATCTTTATTTATTATTGT
ACACAGGAAAATTGGTTAAACCAAGTAAAGGAGATGCAGACACAGTGTGG
CTGTGGTCTTTCCCAGCTTACTGGAAAACCTGGTATGCAGCAACTAGGGA
TACCGGGGACTGAATACAGGTAAATTTCAAGGAACAATCTAATCGTGTTA
AAAACATGAAAGGCTTTCTAGGAATTCCGAATAGCAACATCCTCTCATCT
TTGTAAAGCGAAAGCACCAAAATTACACAAAAATAAGGGTTAAGTGTCCA
AAAATGGCACATCCAGGGAAGGTGGCTTATGGTTGGTACCCGCTCAAAGC
GTTTTAAAACTGCTTTACAAGTGGAACACCATTTTCCACTTTTAGGAGGT
ACCCAATTATTATAAAAATTTAGTGTCACTGGCATGTGTTTTGCACGCAT
GAGTAACACGGGCGCCTTTATCAAAATTTCAAGCAATAATGCCTTAAAGA
TCACGTCTGGAGAATCTGACCCCAAATATCACTATATAATGTTACATCGT
TTAGCGTTTATAATTTTTTTTAAAGAAAAAAAACGTTATATCGTGTTGCC
TTTGCTGTTATTTTTAAGCCCAAACCCATAAGAAAAATACATACAAACCC
TATAAACATTAACGCAGATGATGTAATGTTATGAGATAATATACTTTATC
TAACATTGGAAGCCCAAGCCCAGATAAAATATCAATGCTACATCATGTAG
TGTTTTATTCTTATAAATCCTAACGATACATGATACAGTGTTTTAATATG
GTATCCAGAGCTGCGATATTTTCATAATATGATATTTAGGGCATTTCAAC
TCTAAATTGTGATATTAGGCCTTTTCTCTGGAGGGTTCATTGAGTTACTT
GGGTGCTAAAATGGCTCACACTTCTTGGTAACCAACTGACATCACAGCAT
TACGTCATGGTTCATCTATAATAGCAATGAGGAAGATCATCATATCTTTC
TTAGGCAGAAAACATCTCTGGGGAGACTAACTAGGTACTAATCTCACTAT
CTGATCATGATACTGCAGGATAGAGAATTCCGAGGACTTGGAAGGAGTTG
TAGCAGTGATGGCAGCCGCGGCTGCATTTTATTCGACGTGCAACTTCTCA
GTGGAAAACTTGCCCTGCTTTTGA
Sequence Length: 
25674
Sequence Checksum: 
75df83a5c8683ff1433a06d579064df4
View location in JBrowse: 
Cds: 
>DCAR_029743cds ATGGCAGAAATCGACGACAAACCGTCTCAACCCTCCCCTTCCATCTCCAA ATCTCCGGTGACCTACGCCATCTGGCCCCCCTCCCAACGCACCTGCAACG CCGTCACCAAACGCCTCCTCGAGACGCTCTCCTCCCCCTCTGTCATCTCT AAGCGCTACGACACGCTTCCCGAGGAAAAGGCGCGAGTGATTGCCGCCAA GATCGAGGGCGAGGCGTTCGCCACCGCCTTCATCACCGCGTCGCCCGATG ACGATGGGATTGAGATTCTCCAGGGCTACGAGTCAAAAACACTGCTTCTG ATCTCGCATGCTTTTGAGGCATGTAATCATTTTTCTTCACTGATTTTATT GCTCACTTCTAAGACTGGTGATTTCAGACGACCTCTCCGCGCCTTGGTTT TAGGTATGCACCGAGTGGGAAGTTCCGGGAACACGTCGAATTCGGTTCGT CCGCGGAAAGAGAAGAGGCTGACTTATGTGTTGAGCGATGCGGATGATAC TAAGCATTGTGCGGGTATAAATTGCTTGGCTTTATTGAAGTCACCCGTAC CTGATGGGCACGACTCCCTCTTCACTGGGAGCCGTGATGGCACCTTAAAG AGATGGACAATAGCTGATAATAATGCTACCTTCTCGACTACCTTTGAGTC TCATATAGACTGGGTCAATGATGCTGTCCTTGCAGGTGGTAATACACTAG TTTCCTGCTCATCGGACACCACAGTCAAGACATGGAATTCTTTGTCAAAT GGAACTTGCACCAGGACTCTTCGTCAACATTCTGATTATGTTACATGCCT TGCTGCAGCAGAAAGAAATGGGAACATTGTTGCCTCCGGTGGGCTTGGTG GTGAGGTCTTCATATGGGATGTTGAAGCTGCCCTTTCTCCTGTCACCAAG TCTAGTGATACCGCGGAAGACGATTGTTCAAATGGTAACGGTGCCGGAAA TTCACAACCGACTACTAGTCTAAGGACTGTCGGATCAAGTAATAGCATTT CCTTGCACACAACACAGTCACAAGGATATGTGCCTATTACTGCTAAAGGC CATAAAGAATCAGTTTATGCATTGGCAATGAATGATACCGGTAGCCTTCT TGTTTCTGGTGGAACAGAGAAGGTTGTGCGTGTTTGGGACCCCAGAAACG GTTCAAAGACCATGAAGCTGAAAGGGCATACAGATAATATTAGGGCATTG CTTTTGGATTCTACTGGCAGACTTTGGGACCTTGGCCAGCAGCGTTGCGT GCATTCATATGCTGTGCATACAGATTCAGTTTGGGCACTTGCTAGTACCC CCACTTTCAGTCATGTTTATAGTGGTGGCAGAGATCTTTCTTTGTACTTG ACAGACTTGTCAACAAGAGAAAGTATCCTACTTTGCACAAAGGAACATCC CATCTTACAGTTGTCATTGCATGATGATAGTATATGGGCTGCAACTACAG ATTCCTCTGTACATAGATGGCCAGCTGAGGTTCACAATCCTCAAAAGGCT TTCCAAAGGGGTGGCTCATTCTTGGCTGGAAATCTGTCATTTTCAAGGGC AAGAGCTTCATTAGAAGGGTCTACTCCTGTTCCTGTATATAGAGAACCAT CGCTTAGCATACCTGGGACTCGAGGAATCGTGCAACATGAAATTTTGAAC AACAGAAGGCATGTTCTCACTAAGGATACTGTTGGTTCAGTGAAGCTGTG GGAAATTACCAGAGGGGTTGTCATTGAAGACTACGGAGAGGTTTCTTTTG AGAAGAAGAAGGAAGATCTTTTTGAAATGGTAAGTATTCCTGCATGGTTC ACTGTGGATACCAGGCTTGGGAGCTTGTCTATACATTTGGATACCCCACA ATGCTTCTCTGCTGAGATGTATTCTGCAGATCTTAATATTGTCGGGAAAC CTGAGGATGACAAGATCAATTTAGCTCGGGAAACCCTTAAAGGTCTGCTA GCTCATTGGTTGAGCAAAAGAAGGAACAGATTTGGAACCAAGGCCTTGGC AAACGGTGATGTTCCTACTGGTAAGGAGATTACTTCAAGGAGCATCACCC TTTCGAAAGTCGAGGTAGATGGCAACAGTGAAAACGACTCTTTGGTGTAT CCTCCATTTGAATTCTTAGCATCTTCATCTCCCTCTATTATTACCGAGGG CTCCCAAGGTGGCCCATGGAGGAAAAAGATTACAGATCTGGATGGCACAG AAGACGAAAAGGACTTCCCCTGGTGGGTTTTAGACTGTGTATTAAATAAC CGTCTGCCTCCCAGGGAAAACACCAAATGCAGCTTCTATCTACAACCTTT GGAAGGTTCAGCTGCCCAGATGCTTACACAAGGGAAACTGAGTGCGCCTC GCATATTGAGAGTACACAAAGTTGTTAATTACGTGGTTGAAAAGATGGTA CTCGACCAACCGTTGGATATTGTAAACCCCGAAGGAGCTAAATCTTCTGG ATTACCCGGAGGACAGATACAGCATACATCTTCAGGAGGAGATGCTTCTT TTCGATCTGGTTTAAAACCCTGGCAGAAGCTGAAGCCTTCTATAGAGATC TTGTGCAATAATCAGTTTGCGATCAATGGAACAGGGATTGTCCCACATTA TACAAAATATTGGATGAAAGGACATGCTGCTGATAGTTACTATGCTGCTC AGAAAGAAATGTTTCGAGCCAAAAGAGAAGCTATTACCATGAATTCTGAT GTTACTCAATCAGTAGAAAGGAAGAAGGGCGCTGCCTGTACAGCACTTGA TCTAAATGCCACAGTTGATTTGACCAAAGACAGGACTCCAGCGTGTGCTT ATAACAACAACAATCTGACCTCTAGTTCTAATATCAAGATCGACAAGTTA AAAGGCTTTGGCTTTGATCTCAATGTGGAAGATGTTTCAAGTTCTGCTGA TTATGACCTAGTCTGTCCTAATAAACATATTAAGCAATTAAAACTAAGAG ATGATTCGGAGTGTGAGAGTACGTGTAATCCAGTGGAAGATAAAGATCCA ATGAAAGTATGGAAAGAGATGAAGCAAAATGGTTTCATGTCATCTTCCCA TGGAGGTATACCAATTCCAAAACCACGTGGGAGGAAAAGTAAAGCTGACG GTCTCAAAAAAAAGATGGAAATTGCCAGGAGGGAACAGGTTGATAGGTTT GCAAAGATTGCTGCTCCTAGTGGACTGCTCAATGGATTGAATCCTGGGAT TATTAACCATGTAAGAAACAGCAAGCAGGTTCATTCTATAATTGAGGCTC TAGTAAGGTCTGAAAGACGTCACAATTTCCATACTGGAAACAACAAAGAG AAAATTCAGATGAAGACAGAAAGAATAGAATCAAGTGATAACCGAAGAAA CCTGAACTTGTCAGGAATTGAAGGATATAATCTTTGTCAAGAAGATTGTC TGCTAAATAATGCATTAACAATCAGACAGACAAGTCACTTCCCAGTACGA GACAACAATGCCTCAAGCTTGGATACCAGCACTTTGTGTGATCAAGACTC GACAGACTTATCAAGCGTTTCTTCTTTATCTTTCAAAGCTGCTAATGTAG CTTCCCAGTGGCTAGATCTTCTTCAACATGACATAAATGGTCGCCTTGGA GCACTACGACGCAGTAAGAAAAGAGTTCGATCTGTTATTCAAACGGAGCT CCCTCTTCTTATATCTGGAGAATTTTCTCATAATCAGGAGAATGATACTT ATGTTAGGAAGATTCCCTTCTCTACTTCATCAGTGAATGCAACAGCAAAC ATGCACAAAGCTAAATGGAACGTGCTGTTTAATCAGATGGAAAATGCACT TTTGAGTGAAGAGAGGCAACTGGAAAATTGGTTAAACCAAGTAAAGGAGA TGCAGACACAGTGTGGCTGTGGTCTTTCCCAGCTTACTGGAAAACCTGGT ATGCAGCAACTAGGGATACCGGGGACTGAATACAGGATAGAGAATTCCGA GGACTTGGAAGGAGTTGTAGCAGTGATGGCAGCCGCGGCTGCATTTTATT CGACGTGCAACTTCTCAGTGGAAAACTTGCCCTGCTTTTGA
Pep: 
>DCAR_029743pep MAEIDDKPSQPSPSISKSPVTYAIWPPSQRTCNAVTKRLLETLSSPSVIS KRYDTLPEEKARVIAAKIEGEAFATAFITASPDDDGIEILQGYESKTLLL ISHAFEACNHFSSLILLLTSKTGDFRRPLRALVLGMHRVGSSGNTSNSVR PRKEKRLTYVLSDADDTKHCAGINCLALLKSPVPDGHDSLFTGSRDGTLK RWTIADNNATFSTTFESHIDWVNDAVLAGGNTLVSCSSDTTVKTWNSLSN GTCTRTLRQHSDYVTCLAAAERNGNIVASGGLGGEVFIWDVEAALSPVTK SSDTAEDDCSNGNGAGNSQPTTSLRTVGSSNSISLHTTQSQGYVPITAKG HKESVYALAMNDTGSLLVSGGTEKVVRVWDPRNGSKTMKLKGHTDNIRAL LLDSTGRLWDLGQQRCVHSYAVHTDSVWALASTPTFSHVYSGGRDLSLYL TDLSTRESILLCTKEHPILQLSLHDDSIWAATTDSSVHRWPAEVHNPQKA FQRGGSFLAGNLSFSRARASLEGSTPVPVYREPSLSIPGTRGIVQHEILN NRRHVLTKDTVGSVKLWEITRGVVIEDYGEVSFEKKKEDLFEMVSIPAWF TVDTRLGSLSIHLDTPQCFSAEMYSADLNIVGKPEDDKINLARETLKGLL AHWLSKRRNRFGTKALANGDVPTGKEITSRSITLSKVEVDGNSENDSLVY PPFEFLASSSPSIITEGSQGGPWRKKITDLDGTEDEKDFPWWVLDCVLNN RLPPRENTKCSFYLQPLEGSAAQMLTQGKLSAPRILRVHKVVNYVVEKMV LDQPLDIVNPEGAKSSGLPGGQIQHTSSGGDASFRSGLKPWQKLKPSIEI LCNNQFAINGTGIVPHYTKYWMKGHAADSYYAAQKEMFRAKREAITMNSD VTQSVERKKGAACTALDLNATVDLTKDRTPACAYNNNNLTSSSNIKIDKL KGFGFDLNVEDVSSSADYDLVCPNKHIKQLKLRDDSECESTCNPVEDKDP MKVWKEMKQNGFMSSSHGGIPIPKPRGRKSKADGLKKKMEIARREQVDRF AKIAAPSGLLNGLNPGIINHVRNSKQVHSIIEALVRSERRHNFHTGNNKE KIQMKTERIESSDNRRNLNLSGIEGYNLCQEDCLLNNALTIRQTSHFPVR DNNASSLDTSTLCDQDSTDLSSVSSLSFKAANVASQWLDLLQHDINGRLG ALRRSKKRVRSVIQTELPLLISGEFSHNQENDTYVRKIPFSTSSVNATAN MHKAKWNVLFNQMENALLSEERQLENWLNQVKEMQTQCGCGLSQLTGKPG MQQLGIPGTEYRIENSEDLEGVVAVMAAAAAFYSTCNFSVENLPCF*