研发一款肿瘤易感基因检测产品
这种帮助客户提前预测疾病风险,提前预防的产品比较好做!!
首先 就要说你们公司有多牛,只要是见过面的专家教授都写进公司的顾问列表里,谁不服,就给他点钱,专家找你麻烦,就打马虎眼糊弄过去。反正一般情况下,他也不可能知道居然还是你们公司的顾问。
然后 公司必须都是博士,不是也得让他是!必须扯着一大堆的高校,就说跟他们有合作,哪怕是跟清华的扫地阿姨合作也行。同理,也必须扯上一大堆的高科技旗子,创新基金,各种参会,以及几十上百个检测产品,全方位打击癌症。
再然后 就是癌症背景(姑且定义为科普)介绍啦。最重要的是得突出年龄因素,年轻人就得检测,要烘托出检测的氛围,让读者觉得不检查会死翘翘。然后讲几个故事,朱莉切掉乳房的故事你不提一下就不要在业界混了,再找找有没有切卵巢,切小鸡鸡的。故事一定要生动一点!
之后 谈一下自己的产品适用的人群吧。也不要吹的太过了,差不多一半人就好了。中国人那么多,有一半的人需要使用你的产品就已经很可怕了。
最后 再把自己的产品信息介绍一下。一次性检测几万个基因,几百种癌症的风险,再来个男性女性特殊套餐,再诱惑一点。 接着也是扯自己的优势咯,什么先进的检测平台(测序仪肯定不是你的!!),全面的检测内容(反正就是数据库列出来的~),专业的数据分析(TMD谁知道你专业与否,又没有评价标准!!),贴心的跟踪服务(一收就是几万块,不贴心都难呀!!)。
回过头来再扯一下癌症跟遗传相关,患病风险是可以检测的。
差不多了吧,高人可以在下面跟帖补充一下!
小提示
科学顾问最好是选择一些外国人!这样别人找麻烦也没那么快!也不大可能一下子就识破你!
优秀示例
遗传信息解读参考美国医学遗传学与基因组学学会(ACMG)联合分子病理学学会(AMP)发布的基因突变的解读指导原则。参考数据库包括人类基因组突变数据库(HGMD),国际生物技术信息中心(NCBI)数据库,美国国立卫生研究院(National Institutes of Health,NIH)乳腺癌研究中心数据库,公司自建中国人群乳腺癌突变信息数据库及其他公共数据库,如Pumed、dbSNP、1000Genomes。同时,解读结果由耶鲁大学医学院乳腺癌分子研究专家审核。
乳腺癌的基因panel分析指引
发表在breast Cancer Research 2015 的 https://doi.org/10.1186/s13058-015-0642-8
Next generation sequencing (NGS) was performed for 1,977 genes involved in tumorigenesis.
DNA from 56 pre-treatment TNBC-biopsies was sequenced, as well as matched normal DNA.
有somatic的SNVs的分析,还有CNV分析,还有 Sanger sequencing for validation of PIK3CA mutations
数据并不提供下载
但是附件有一些资料
Additional file 2: Table S1. 1977 Cancer Gene Panel. This file lists all 1,977 genes in the Cancer Gene Panel, used in this study. (XLS 111 kb)
Additional file 3: Table S2. Overview of sequencing statistics. (XLSX 48 kb)
然后奇丑无比的图:
肿瘤测序数据分析流程
module load java/1.8.0_91
GENOME=/home/jianmingzeng/biosoft/GATK/resources/bundle/hg38/Homo_sapiens_assembly38.fasta
INDEX=/home/jianmingzeng/biosoft/GATK/resources/bundle/hg38/bwa_index/gatk_hg38
GATK=/home/jianmingzeng/biosoft/GATK/gatk-4.0.2.1/gatk
DBSNP=/home/jianmingzeng/biosoft/GATK/resources/bundle/hg38/dbsnp_146.hg38.vcf.gz
kgSNP=/home/jianmingzeng/biosoft/GATK/resources/bundle/hg38/1000G_phase1.snps.high_confidence.hg38.vcf.gz
kgINDEL=/home/jianmingzeng/biosoft/GATK/resources/bundle/hg38/Mills_and_1000G_gold_standard.indels.hg38.vcf.gz
# step1: QC
$bin_trim_galore -q 25 --phred33 --length 50 -e 0.1 --stringency 3 --paired -o $analysis_dir/clean_fastq $fq1 $fq2
# step2: alignment
bwa mem -t 5 -M -R "@RG\tID:$sample\tSM:$sample\tLB:WES\tPL:Illumina" $INDEX $fq1 $fq2 1>$sample.sam 2>/dev/null
$GATK --java-options "-Xmx25G -Djava.io.tmpdir=./" SortSam \
-SO coordinate -I $sample.sam -O $sample.bam #1>log.sort 2>&1
samtools index $sample.bam
sambamba markdup --overflow-list-size 600000 --tmpdir='./' -r $sample.bam ${sample}_marked.bam
$GATK --java-options "-Xmx25G -Djava.io.tmpdir=./" FixMateInformation \
-I ${sample}_marked.bam -O ${sample}_marked_fixed.bam -SO coordinate
samtools index ${sample}_marked_fixed.bam
time $GATK --java-options "-Xmx20G -Djava.io.tmpdir=./" BaseRecalibrator \
-I $bam -R $GENOME --output ${sample}_recal.table --known-sites $kgSNP --known-sites $kgINDEL
time $GATK --java-options "-Xmx20G -Djava.io.tmpdir=./" ApplyBQSR \
-I $bam -R $GENOME --output ${sample}_recal.bam -bqsr ${sample}_recal.table
# step3: call germline
$GATK --java-options "-Xmx20G -Djava.io.tmpdir=./" HaplotypeCaller \
-ERC GVCF -L $bed -R $GENOME -I $bam --dbsnp $DBSNP -O ${sample}_raw.vcf
# step4: call somatic
time $GATK --java-options "-Xmx10G -Djava.io.tmpdir=./" Mutect2 -R $reference \
-I $tumor_bam -tumor $(basename "$tumor_bam" _recal.bam) \
-I $normal_bam -normal $(basename "$normal_bam" _recal.bam) \
-pon Normal_pon.vcf.gz -L $bed \
-O ${sample}_mutect2.vcf
$GATK FilterMutectCalls -V ${sample}_mutect2.vcf -O ${sample}_somatic.vcf
# step5: call CNV
cnvkit.py batch --method amplicon tumor_bam/*.bam \
--normal normal_bam/*.bam \
--targets hg38.baits.bed \
--fasta /home/jianmingzeng/biosoft/GATK/resources/bundle/hg38/Homo_sapiens_assembly38.fasta \
--output-reference my_reference.cnn --output-dir T_results