常用生物信息在线工具

声明:本文所列工具均为较为初级的生物信息分析,只用于简单的分析过程,更加优秀的工具和准确的分析结果我也在不懈寻找中,同样也欢迎大家留言提供,一个分析结果最好是能够综合不同方式所得结果。

韦恩图

Venny2.0

升级版韦恩图

jvenn: 可做到6个

基因预测

FGENESH

phylogenetic

iTOL

启动子区预测

Promoter Scan

蛋白质一级结构分析

PredictProte

ExPASy-ProtParam tool

蛋白质磷酸化位点

NetPhos 2.0

信号肽

SignalP

跨膜结构域

TMHMM Server v. 2.0

蛋白质亚细胞定位

TargetP 1.1 Server

蛋白质二级结构分析

SOPMA

蛋白质三级结构预测

SWISS-MODEL

短序列拼接

Cap3

多序列比对相似性展示

SimiTriX-SimiTetra

绘制GO注释结果

WEGO:Web Gene Ontology Annotation Plotting

蛋白质

Pfam database
meme:Multiple Em for Motif Elicitation
SMART
Conserved Domains within a protein or coding nucleotide sequence
1. 模体(motif)
属于蛋白质的超二级结构,由2个或2个以上具有二级结构的的肽段,在空间上相互接近,形成一个特殊的空间构象,并发挥专一的功能。一种类型的模体总有其特征性的氨基酸序列。
模体是二级结构有规律的组合。例如螺旋-环-螺旋,贝塔折叠的组合、阿而法螺旋组合等。再比如亮氨酸拉链、锌指结构都是典型的模体,它们执行一定的功能,即模体即是结构的单位,又是功能单位,他们可直接作为结构域和三级结构的建筑块。某些蛋白质因子与DNA大沟结合的部位靠的就是某些特异的模体。
2. 结构域(domain)
是指在较大的分子(主要指蛋白质也包括核酸分子)中形成的某些在空间上可以辨别的结构,往往是球状压缩区或纤维状压缩区。它们也既是结构单位,又是功能单位。例如免疫球蛋白的功能区就是结构域。

基因组杂合性评估

GenomeScope:Estimate genome heterozygosity, repeat content, and size from sequencing reads using a kmer-based statistical approach

circos图

CIRCOS可以用来画基因组数据的环状图,也可以用来绘制其它数据的相关环状图。

1. 需要注意的是上传数据格式为空格或tab分隔的txt格式纯文本列表文件,值均为非负整数,若存在缺失值,用“-”线代替,若有小数,每一个单元格乘以某一值(如1000),化为整数,且每个单元格中只能有数字,其他任何符号都不行,除了缺失的“-”,(1555,而不是1,555);
2. 在线版只能绘制75阶方阵数据,若需要绘制较复杂的请下载Circos and use the tableviewer tool。
3. 每一个标签所对应半圈的总长度为这一标签所对应的所有值的和,不同半圈间连线表示这两标签所表示的值。

元数据可视化

Web-Igloo:Interactively visualizing multivariate data without feature decomposition

需要数据和元数据两个文件,实例数据结构如下:
数据(Select data file (Tab delimited))

Samples Palmitic Palmitoleic Stearic Oleic Linoleic Linolenic Arachidic Eicosenoic
S1 1075 75 226 7823 672 36 60 29
S2 1088 73 224 7709 781 31 61 29
S3 911 54 246 8113 549 31 63 29
S4 966 57 240 7952 619 50 78 35
S5 1051 67 259 7771 672 50 80 46
S6 911 49 268 7924 678 51 70 44
S7 922 66 264 7990 618 49 56 29
S8 1100 61 235 7728 734 39 64 35
S9 1082 60 239 7745 709 46 83 33
S10 1037 55 213 7944 633 26 52 30
S11 1051 35 219 7978 605 21 65 24
S12 1036 59 235 7868 661 30 62 44

元数据(Select metadata (Tab delimited))

Samples Geography
S1 N
S2 N
S3 N
S4 NA
S5 NA
S6 NA
S7 NAp
S8 NAp
S9 NAp
S10 NApulia
S11 NApulia
S12 NApulia

基因结构展示

GSDS2.0: Gene Structure Display Server

AnnotationSketch

外显子-内含子结构

Exon-Intron Graphic Maker
MyDomains
DomainDraw draws

蛋白突变位点注释

MutationMapper: interprets mutations with protein annotations

regulatory genes 分析

Transcription factors, transcription regulators, and chromatin regulators, collectively referred to as regulatory genes.
PlantTFcat: An Online Plant Transcription Factor and Transcriptional Regulator Categorization and Analysis Tool

密码子偏好性 (Codon Optimization)

Codon Optimization On-Line (COOL)

Codon Optimization Tool:Integrated DNA Technologies

tiramisutes wechat
欢迎关注