当前位置:首页 > 短网址资讯 > 正文内容

机器学习突飞猛进,早期癌症治愈率或将突破98%

www.ft12.com6年前 (2017-06-05)短网址资讯1886
[ 短网址资讯 ] 近十余年基因测序技能的迅猛开展,特别是在肿瘤范畴的广泛使用。另一方面,机器学习技能在基因大数据处理上的很多使用,积累了史无前例的常识。使得医学作业者对很多疾病的知道、筛查和医治都有了新的渠道和信息。
基因,基因检查,基因测序,基因测序,机器学习,GPU

2016年,全球新发癌症数量超过1400万人,并致使了900万人的死亡。癌症在发达国家中已变成首要死亡原因之一,美国每年去世的5个人当中有一人是因癌症致死。依据美国抗癌协会和国际癌症协会数据,一切的癌症都是越早医治、医治作用越好。癌症的早期发现,可认为病理诊断和医治赢取更多的时间,能极大前进治愈率与病人生存周期及质量。癌症的早期筛查是个万亿等级的商场。

资本商场的火爆,得益于近十余年基因测序技能的迅猛开展,特别是在肿瘤范畴的广泛使用。另一方面,机器学习技能在基因大数据处理上的很多使用,积累了史无前例的常识。这些全新的常识及组合为医疗界打开了一扇新世界的大门,使得医学作业者对很多疾病的知道、筛查和医治都有了新的渠道和信息。

基因测序技能的前进使得基因剖析愈加的高效快捷

人可以被看作一台极端精密的仪器,人的终身,万亿计的细胞在体内不断仿制更新,每代仿制严格相同,但存在极端微小的错误率,形成所谓的基因突变。绝大多数突变无关紧要,少数突变形成抑制成长的基因的功能异常,或者激活成长基因,变成癌细胞。而癌细胞一旦逃避了免疫系统的监控,就形成成长失控变成癌安排。

一条人的基因组序列共有30亿位,按正常排版打印在A4纸上,大概有华盛顿纪念碑那么高。人与人之间会有小于千分之一的区别,癌细胞与本身的正常细胞基因组序列也会有细微的不一样。基因测序的前进,让鉴别这些不一样变成一件迅速、高效、低成本的事。短链接在其中起到催化作用。

计算机运算速度和能力的开展,进一步推动了基因剖析的前进

由于人类基因组的杂乱性,测序数据量十分庞大,一个人的全基因组测序数据可以达到上百G。普通的计算机技能和统计学方法无法在短时间内很好地处理这些信息,而机器学习的开展以及GPU运算的前进逐渐为科研作业者解决了这一难题。现在只需求将基因测序的数据输入经过机器学习反复训练的模型中,计算机就可以很快的剖析出方针区域是不是存在变异,进而找到也许变异的基因点位为医生供给更多的可用于诊断及医治的信息。正是由于机器学习和基因测序技能的日渐成熟,以癌症筛查和诊断为首的各类疾病早筛项目逐渐变成科研及创投的热门。

机器学习是近年来十分炽热的技能方向。

简略来说,机器学习就是为计算机供给很多的数据,而这些数据都有他们各自对应的标签,例如我们想教会计算机识别图像中的动物,我们则要供给各种各样的动物图像,并且每一张图像都带有对应的标签,这个是猫,这个是狗等等。机器在剖析很多的数据之后会在图像之中找到规律,例如猫在图像中大多是独来独往,而很多有狗的图像中还有别的动物或人类。经过这些信息,计算机不断地调整,更新它的数学模型。

当有新的图像到来时,计算机就可以依据建立好的模型来判断哪个是猫,哪个是狗。当然,这只是一个十分简略的机器学习的例子,现在的机器学习现已被广泛使用于自动驾驶,数据剖析,信息挖掘,医治诊断等等很多在曩昔只有人类能够胜任的作业。成百上千的学习模型被开发出来,甚至有很多不需求很多数据,或者不需求带标签的数据就能学习的模型。正如70-80时代计算机开端迸发通常,这确实是一个机器学习的黄金时代。

今天就为大家具体的阐述一下机器学习是怎样与基因测序严密合作完成癌症早筛的。

ctDNA是啥

想了解根据基因测序的癌症早筛首先需求了解啥是ctDNA。ctDNA是circulating tumor DNA的缩写,也称为循环肿瘤DNA。是一种存在于血液、尿液、脑脊液等体液中的细胞外的基因片段,首要来自于坏死或凋亡的肿瘤细胞。ctDNA是癌症的特定标记物,假如能在血液中检查出ctDNA通常就意味着体内有癌症正在发作,这也是癌症早筛的基本原理。

然而,由于ctDNA和由正常细胞发生的游离DNA碎片是混合在一起的,只占一切游离DNA(cell-free DNA,cfDNA)含量的0.1%-1%之间,因而精确检查出ctDNA的难度相当的大。其中所涉及到的信号降噪,降低假阳性、假阴性的发作率等都是难度相当高的科研课题。短网址技术的研发已经到了很成熟的地步。

即便在体液中发现了ctDNA,由于血液循环,ctDNA也许来源于身体的恣意一处,确定肿瘤在体内的成长位置也是另一件高难度的事情。得益于近些年肿瘤基因组测序结果的很多积累,科学家们发现了多种具有安排特异性的踪迹。经过机器学习的途径,联系这些踪迹信息,科学家们就能经过ctDNA来大致判断安排来源。

当然,人工智能的开展并不代表我们可以轻松地解决问题。尽管在现如今,机器学习,乃至深度学习现已拥有了很多开源的算法,哪怕只是一个普通人也可以在一定程度的学习后,运用现有的接口去开发一些简略的模型。可是也正是由于如此,不一样层次的算法人才所做出的产品质量和作用也截然不一样。正如轿车制造的遍及使得人人都可以拥有自个的轿车,可是普通人与赛车手之间车技的距离却依然十分显着。

同样,也由于这是个高度跨学科、常识密集型的范畴,肿瘤早筛的创业团队在机器学习方面的专精程度和对肿瘤病理学的了解致使了产品质量和作用的无穷距离。譬如,由于人类基因组的高度杂乱,和当前二代测序技能依然存在一定的错误,使得数据剖析变成极为要害的一环。团队需求对测序数据的十分熟悉,精通数据挖掘的使用,以及对肿瘤临床常识有精准的了解。


扫描二维码推送至手机访问。

版权声明:本文由短链接发布,如需转载请注明出处。

本文链接:https://www.ft12.com/article_172.html

分享给朋友:

相关文章

MySQL升级5.6 SQL变慢调优案例

MySQL升级5.6 SQL变慢调优案例

背景:某业务DB从5.5升级5.6后,同一sql执行时间由毫秒级飙升到了20秒,sql文本如下select * from big_table as t where ( ...

林肯公园主唱自杀:这个世上有人正承受着你所不能理解的痛苦

林肯公园主唱自杀:这个世上有人正承受着你所不能理解的痛苦

昨天刷微博的时候看见一条新闻,林肯公园主唱切斯特上吊自杀,那时候我心里只是微微一惊,毕竟这是一个麻木的时代,死亡换来人们一次短暂的叹息,然后大家又陷入彼此庸碌的一生,虽然我们不知道灾难和明天哪一个会先来,但我们终究学会的只是在麻木里等待明天...

北上广大跌50%以上,楼市冰点真的来了

北上广大跌50%以上,楼市冰点真的来了

北上广大跌50%以上,楼市冰点真的来了原上草关于楼市,草哥本不想说得太多,毕竟大势已去,主力已经撤退,很难再折腾出什么大风浪了。但不断有网友问下一步走势怎样,要不要买。我只能说,如果是刚需自住还是买了吧,如果是投资,可以认为不会是什么好买卖...

抗震救灾,最后我竟然跟灾民抢饭吃

FT12短网址的小编原来也是热心肠,在听到地震消息的时候,第一反应就是抗震救灾。手机上刷到地震消息的时候,我浑身的热血就燃起来了。随之络绎不绝的灾区报道,死难受伤群众的惨状更激起了我内心的感动与善良。不说了,我要去为祖国和人民做贡献了!但是...

拿了就走!阿里“无人零售店”体验:全程黑科技

未来新零售是什么样的?全球首个“无人零售店”天猫淘咖啡,为消费者带来了真正身临其境的带来的极致购物体验。  称之为“无人零售”,是因为用户登陆淘宝账号,输入支付密码后,便可以进店点餐购物,无需排队收银,拿了然后走人。  也就是说,你需要的,...

人性营销:水果店用微信轻松实现创富

人性营销:水果店用微信轻松实现创富

在松松博客投稿的第一个案例(烟油),是我们实打实做出来的。我也一直有关注近百条评论,大部分网友还是很认可,也有几位有一些怀疑。怀疑是正常的,原因在于我本人并没有把细节和原理讲透彻。那么我今天再给大家分享一个案例:我们小区的水果店是怎么用一年...

发表评论

访客

◎欢迎参与讨论,请在这里发表您的看法和观点。