声明:本文所列工具均为较为初级的生物信息分析,只用于简单的分析过程,更加优秀的工具和准确的分析结果我也在不懈寻找中,同样也欢迎大家留言提供,一个分析结果最好是能够综合不同方式所得结果。
韦恩图
Venny2.0
升级版韦恩图
jvenn: 可做到6个
基因预测
FGENESH
phylogenetic
iTOL
Evolview v3
在线构建进化树
IQTREE Web Server: Fast and accurate phylogenetic trees under maximum likelihood
启动子区预测
Promoter Scan
蛋白质一级结构分析
PredictProte
ExPASy-ProtParam tool
蛋白质磷酸化位点
NetPhos 2.0
信号肽
SignalP
跨膜结构域
TMHMM Server v. 2.0
蛋白质亚细胞定位
TargetP (Subcellular location of proteins: mitochondrial, chloroplastic, secretory pathway, or other)
DeepLoc (Prediction of eukaryotic protein subcellular localization using deep learning)
蛋白质二级结构分析
SOPMA
蛋白质三级结构预测
SWISS-MODEL
短序列拼接
Cap3
多序列比对相似性展示
SimiTriX-SimiTetra 和
Ternary plot
多序列比对可视化
MView: A multiple alignment viewer
or
AlignmentViewer
过滤多序列比对结果
GUIDANCE2 Server: Server for alignment confidence score
绘制GO注释结果
WEGO:Web Gene Ontology Annotation Plotting
蛋白质
Pfam database
meme:Multiple Em for Motif Elicitation
SMART
Conserved Domains within a protein or coding nucleotide sequence
模体(motif)
属于蛋白质的超二级结构,由2个或2个以上具有二级结构的的肽段,在空间上相互接近,形成一个特殊的空间构象,并发挥专一的功能。一种类型的模体总有其特征性的氨基酸序列。
模体是二级结构有规律的组合。例如螺旋-环-螺旋,贝塔折叠的组合、阿而法螺旋组合等。再比如亮氨酸拉链、锌指结构都是典型的模体,它们执行一定的功能,即模体即是结构的单位,又是功能单位,他们可直接作为结构域和三级结构的建筑块。某些蛋白质因子与DNA大沟结合的部位靠的就是某些特异的模体。
结构域(domain)
是指在较大的分子(主要指蛋白质也包括核酸分子)中形成的某些在空间上可以辨别的结构,往往是球状压缩区或纤维状压缩区。它们也既是结构单位,又是功能单位。例如免疫球蛋白的功能区就是结构域。
基因组杂合性评估
GenomeScope:Estimate genome heterozygosity, repeat content, and size from sequencing reads using a kmer-based statistical approach
circos图
CIRCOS可以用来画基因组数据的环状图,也可以用来绘制其它数据的相关环状图。
1. 需要注意的是上传数据格式为空格或tab分隔的txt格式纯文本列表文件,值均为非负整数,若存在缺失值,用“-”线代替,若有小数,每一个单元格乘以某一值(如1000),化为整数,且每个单元格中只能有数字,其他任何符号都不行,除了缺失的“-”,(1555,而不是1,555);
2. 在线版只能绘制75阶方阵数据,若需要绘制较复杂的请下载Circos and use the tableviewer tool。
3. 每一个标签所对应半圈的总长度为这一标签所对应的所有值的和,不同半圈间连线表示这两标签所表示的值。
元数据可视化
Web-Igloo:Interactively visualizing multivariate data without feature decomposition
需要数据和元数据两个文件,实例数据结构如下:
数据(Select data file (Tab delimited))
Samples Palmitic Palmitoleic Stearic Oleic Linoleic Linolenic Arachidic Eicosenoic
S1 1075 75 226 7823 672 36 60 29
S2 1088 73 224 7709 781 31 61 29
S3 911 54 246 8113 549 31 63 29
S4 966 57 240 7952 619 50 78 35
S5 1051 67 259 7771 672 50 80 46
S6 911 49 268 7924 678 51 70 44
S7 922 66 264 7990 618 49 56 29
S8 1100 61 235 7728 734 39 64 35
S9 1082 60 239 7745 709 46 83 33
S10 1037 55 213 7944 633 26 52 30
S11 1051 35 219 7978 605 21 65 24
S12 1036 59 235 7868 661 30 62 44
元数据(Select metadata (Tab delimited))
Samples Geography
S1 N
S2 N
S3 N
S4 NA
S5 NA
S6 NA
S7 NAp
S8 NAp
S9 NAp
S10 NApulia
S11 NApulia
S12 NApulia
基因结构展示
GSDS2.0: Gene Structure Display Server
AnnotationSketch
外显子-内含子结构
Exon-Intron Graphic Maker
MyDomains
DomainDraw draws
蛋白突变位点注释
MutationMapper: interprets mutations with protein annotations
regulatory genes 分析
Transcription factors, transcription regulators, and chromatin regulators, collectively referred to as regulatory genes.
PlantTFcat: An Online Plant Transcription Factor and Transcriptional Regulator Categorization and Analysis Tool
密码子偏好性 (Codon Optimization)
Codon Optimization On-Line (COOL)
Codon Optimization Tool:Integrated DNA Technologies
序列格式转换(Sequence Format Conversion)
EMBOSS Seqret
真菌效应蛋白预测
EffectorP: predicting fungal effector proteins from secretomes using machine learning
BLAST结果可视化
kablammo: Visualize your BLAST results
or
Circoletto
植物基因家族分类和富集分析
GenFam: Gene Family based classification and enrichment analysis
生物类文件格式转换
Sequence conversion
Plant-Specific Myristoylation Predictor
Plant-Specific Myristoylation Predictor
启动子元件预测
Plant CARE: Search for CARE
植物启动子/转录因子分析
PlantPAN 3.0
转录组分析
iDEP
简并引物设计
Genefisher 2
词云 wordcloud
WordCloud Generator
Free Word Cloud Generator