当前位置:首页 > 短网址资讯 > 正文内容

机器学习突飞猛进,早期癌症治愈率或将突破98%

www.ft12.com9年前 (2017-06-05)短网址资讯2749
[ 短网址资讯 ] 近十余年基因测序技能的迅猛开展,特别是在肿瘤范畴的广泛使用。另一方面,机器学习技能在基因大数据处理上的很多使用,积累了史无前例的常识。使得医学作业者对很多疾病的知道、筛查和医治都有了新的渠道和信息。
基因,基因检查,基因测序,基因测序,机器学习,GPU

2016年,全球新发癌症数量超过1400万人,并致使了900万人的死亡。癌症在发达国家中已变成首要死亡原因之一,美国每年去世的5个人当中有一人是因癌症致死。依据美国抗癌协会和国际癌症协会数据,一切的癌症都是越早医治、医治作用越好。癌症的早期发现,可认为病理诊断和医治赢取更多的时间,能极大前进治愈率与病人生存周期及质量。癌症的早期筛查是个万亿等级的商场。

资本商场的火爆,得益于近十余年基因测序技能的迅猛开展,特别是在肿瘤范畴的广泛使用。另一方面,机器学习技能在基因大数据处理上的很多使用,积累了史无前例的常识。这些全新的常识及组合为医疗界打开了一扇新世界的大门,使得医学作业者对很多疾病的知道、筛查和医治都有了新的渠道和信息。

基因测序技能的前进使得基因剖析愈加的高效快捷

人可以被看作一台极端精密的仪器,人的终身,万亿计的细胞在体内不断仿制更新,每代仿制严格相同,但存在极端微小的错误率,形成所谓的基因突变。绝大多数突变无关紧要,少数突变形成抑制成长的基因的功能异常,或者激活成长基因,变成癌细胞。而癌细胞一旦逃避了免疫系统的监控,就形成成长失控变成癌安排。

一条人的基因组序列共有30亿位,按正常排版打印在A4纸上,大概有华盛顿纪念碑那么高。人与人之间会有小于千分之一的区别,癌细胞与本身的正常细胞基因组序列也会有细微的不一样。基因测序的前进,让鉴别这些不一样变成一件迅速、高效、低成本的事。短链接在其中起到催化作用。

计算机运算速度和能力的开展,进一步推动了基因剖析的前进

由于人类基因组的杂乱性,测序数据量十分庞大,一个人的全基因组测序数据可以达到上百G。普通的计算机技能和统计学方法无法在短时间内很好地处理这些信息,而机器学习的开展以及GPU运算的前进逐渐为科研作业者解决了这一难题。现在只需求将基因测序的数据输入经过机器学习反复训练的模型中,计算机就可以很快的剖析出方针区域是不是存在变异,进而找到也许变异的基因点位为医生供给更多的可用于诊断及医治的信息。正是由于机器学习和基因测序技能的日渐成熟,以癌症筛查和诊断为首的各类疾病早筛项目逐渐变成科研及创投的热门。

机器学习是近年来十分炽热的技能方向。

简略来说,机器学习就是为计算机供给很多的数据,而这些数据都有他们各自对应的标签,例如我们想教会计算机识别图像中的动物,我们则要供给各种各样的动物图像,并且每一张图像都带有对应的标签,这个是猫,这个是狗等等。机器在剖析很多的数据之后会在图像之中找到规律,例如猫在图像中大多是独来独往,而很多有狗的图像中还有别的动物或人类。经过这些信息,计算机不断地调整,更新它的数学模型。

当有新的图像到来时,计算机就可以依据建立好的模型来判断哪个是猫,哪个是狗。当然,这只是一个十分简略的机器学习的例子,现在的机器学习现已被广泛使用于自动驾驶,数据剖析,信息挖掘,医治诊断等等很多在曩昔只有人类能够胜任的作业。成百上千的学习模型被开发出来,甚至有很多不需求很多数据,或者不需求带标签的数据就能学习的模型。正如70-80时代计算机开端迸发通常,这确实是一个机器学习的黄金时代。

今天就为大家具体的阐述一下机器学习是怎样与基因测序严密合作完成癌症早筛的。

ctDNA是啥

想了解根据基因测序的癌症早筛首先需求了解啥是ctDNA。ctDNA是circulating tumor DNA的缩写,也称为循环肿瘤DNA。是一种存在于血液、尿液、脑脊液等体液中的细胞外的基因片段,首要来自于坏死或凋亡的肿瘤细胞。ctDNA是癌症的特定标记物,假如能在血液中检查出ctDNA通常就意味着体内有癌症正在发作,这也是癌症早筛的基本原理。

然而,由于ctDNA和由正常细胞发生的游离DNA碎片是混合在一起的,只占一切游离DNA(cell-free DNA,cfDNA)含量的0.1%-1%之间,因而精确检查出ctDNA的难度相当的大。其中所涉及到的信号降噪,降低假阳性、假阴性的发作率等都是难度相当高的科研课题。短网址技术的研发已经到了很成熟的地步。

即便在体液中发现了ctDNA,由于血液循环,ctDNA也许来源于身体的恣意一处,确定肿瘤在体内的成长位置也是另一件高难度的事情。得益于近些年肿瘤基因组测序结果的很多积累,科学家们发现了多种具有安排特异性的踪迹。经过机器学习的途径,联系这些踪迹信息,科学家们就能经过ctDNA来大致判断安排来源。

当然,人工智能的开展并不代表我们可以轻松地解决问题。尽管在现如今,机器学习,乃至深度学习现已拥有了很多开源的算法,哪怕只是一个普通人也可以在一定程度的学习后,运用现有的接口去开发一些简略的模型。可是也正是由于如此,不一样层次的算法人才所做出的产品质量和作用也截然不一样。正如轿车制造的遍及使得人人都可以拥有自个的轿车,可是普通人与赛车手之间车技的距离却依然十分显着。

同样,也由于这是个高度跨学科、常识密集型的范畴,肿瘤早筛的创业团队在机器学习方面的专精程度和对肿瘤病理学的了解致使了产品质量和作用的无穷距离。譬如,由于人类基因组的高度杂乱,和当前二代测序技能依然存在一定的错误,使得数据剖析变成极为要害的一环。团队需求对测序数据的十分熟悉,精通数据挖掘的使用,以及对肿瘤临床常识有精准的了解。


扫描二维码推送至手机访问。

版权声明:本文由短链接发布,如需转载请注明出处。

本文链接:https://www.ft12.com/article_172.html

分享给朋友:

相关文章

如何在 Linux 下大量屏蔽恶意 IP 地址

如何在 Linux 下大量屏蔽恶意 IP 地址

很多情况下,你可能需要在Linux下屏蔽IP地址。比如,作为一个终端用户,你可能想要免受间谍软件或者IP追踪的困扰。或者当你在运行P2P软件时。你可能想要过滤反P2P活动的网络链接。如果你是一名系统管理员,你可能想要禁止垃圾IP地址访问你们...

FT12短网址资讯:Windows系统补丁怎么打才最合适

FT12短网址资讯:Windows系统补丁怎么打才最合适

近期在全球爆发的WannaCry比特币勒索病毒,重新让用户意识到了Windows系统打补丁的重要性。我个人在很早的时候就非常看重打补丁的意义。可是在这次勒索病毒爆发之前,国内绝大多数用户的看法无非就是这些:不要打补丁,只会越打越卡。Win8...

内容电商的时代 看同路大叔怎样下这盘棋

内容电商的时代 看同路大叔怎样下这盘棋

【ft12短链接网讯】同路大叔——这个靠星座吐槽发家的网红IP,在新浪微博上具有超越1210万名粉丝,微信推送音讯简直能做到条条“十万+”。这个坐拥无穷粉丝集体的自媒体,本来早就走上了内容电商变现的路途。现在同路大叔开设了天猫官方旗舰店,具...

短网址数据库InnoDB的快照读,到底和什么相关?

InnoDB是非常适合短网址业务的存储引擎,其多版本并发控制(Multi Version Concurrency Control, MVCC),快照读(Snapshot Read)机制,能够通过读取回滚段(rollback segment)...

一锅白酒酿

一锅白酒酿

今天早上,收拾着东西去母亲家,女儿从里间蹿了出来,嚷嚷道:“妈妈,你这回千万千万不要从外婆家带东西了,我都吃怕了。”强调的语气让我发笑。刚刚不久,我从母亲家里回来,照例拎回了一堆推辞不掉的食物,其中份量最重的是白酒酿,足足有一大锅,这是我们...

中小研发团队架构实践之总体架构设计

中小研发团队架构实践之总体架构设计

作者|FT12短网址 编辑|短链接 社区里不是缺少架构图,而是缺少确实可参考的架构落地实践。大公司的架构看上去总是不明觉厉,但真要借鉴时却往往无从下手。也许,中小型研发团队的架构实践才是可供复制的?本文是张...

发表评论

访客

◎欢迎参与讨论,请在这里发表您的看法和观点。