当前位置:首页 > 短网址资讯 > 正文内容

机器学习突飞猛进,早期癌症治愈率或将突破98%

www.ft12.com8年前 (2017-06-05)短网址资讯2421
[ 短网址资讯 ] 近十余年基因测序技能的迅猛开展,特别是在肿瘤范畴的广泛使用。另一方面,机器学习技能在基因大数据处理上的很多使用,积累了史无前例的常识。使得医学作业者对很多疾病的知道、筛查和医治都有了新的渠道和信息。
基因,基因检查,基因测序,基因测序,机器学习,GPU

2016年,全球新发癌症数量超过1400万人,并致使了900万人的死亡。癌症在发达国家中已变成首要死亡原因之一,美国每年去世的5个人当中有一人是因癌症致死。依据美国抗癌协会和国际癌症协会数据,一切的癌症都是越早医治、医治作用越好。癌症的早期发现,可认为病理诊断和医治赢取更多的时间,能极大前进治愈率与病人生存周期及质量。癌症的早期筛查是个万亿等级的商场。

资本商场的火爆,得益于近十余年基因测序技能的迅猛开展,特别是在肿瘤范畴的广泛使用。另一方面,机器学习技能在基因大数据处理上的很多使用,积累了史无前例的常识。这些全新的常识及组合为医疗界打开了一扇新世界的大门,使得医学作业者对很多疾病的知道、筛查和医治都有了新的渠道和信息。

基因测序技能的前进使得基因剖析愈加的高效快捷

人可以被看作一台极端精密的仪器,人的终身,万亿计的细胞在体内不断仿制更新,每代仿制严格相同,但存在极端微小的错误率,形成所谓的基因突变。绝大多数突变无关紧要,少数突变形成抑制成长的基因的功能异常,或者激活成长基因,变成癌细胞。而癌细胞一旦逃避了免疫系统的监控,就形成成长失控变成癌安排。

一条人的基因组序列共有30亿位,按正常排版打印在A4纸上,大概有华盛顿纪念碑那么高。人与人之间会有小于千分之一的区别,癌细胞与本身的正常细胞基因组序列也会有细微的不一样。基因测序的前进,让鉴别这些不一样变成一件迅速、高效、低成本的事。短链接在其中起到催化作用。

计算机运算速度和能力的开展,进一步推动了基因剖析的前进

由于人类基因组的杂乱性,测序数据量十分庞大,一个人的全基因组测序数据可以达到上百G。普通的计算机技能和统计学方法无法在短时间内很好地处理这些信息,而机器学习的开展以及GPU运算的前进逐渐为科研作业者解决了这一难题。现在只需求将基因测序的数据输入经过机器学习反复训练的模型中,计算机就可以很快的剖析出方针区域是不是存在变异,进而找到也许变异的基因点位为医生供给更多的可用于诊断及医治的信息。正是由于机器学习和基因测序技能的日渐成熟,以癌症筛查和诊断为首的各类疾病早筛项目逐渐变成科研及创投的热门。

机器学习是近年来十分炽热的技能方向。

简略来说,机器学习就是为计算机供给很多的数据,而这些数据都有他们各自对应的标签,例如我们想教会计算机识别图像中的动物,我们则要供给各种各样的动物图像,并且每一张图像都带有对应的标签,这个是猫,这个是狗等等。机器在剖析很多的数据之后会在图像之中找到规律,例如猫在图像中大多是独来独往,而很多有狗的图像中还有别的动物或人类。经过这些信息,计算机不断地调整,更新它的数学模型。

当有新的图像到来时,计算机就可以依据建立好的模型来判断哪个是猫,哪个是狗。当然,这只是一个十分简略的机器学习的例子,现在的机器学习现已被广泛使用于自动驾驶,数据剖析,信息挖掘,医治诊断等等很多在曩昔只有人类能够胜任的作业。成百上千的学习模型被开发出来,甚至有很多不需求很多数据,或者不需求带标签的数据就能学习的模型。正如70-80时代计算机开端迸发通常,这确实是一个机器学习的黄金时代。

今天就为大家具体的阐述一下机器学习是怎样与基因测序严密合作完成癌症早筛的。

ctDNA是啥

想了解根据基因测序的癌症早筛首先需求了解啥是ctDNA。ctDNA是circulating tumor DNA的缩写,也称为循环肿瘤DNA。是一种存在于血液、尿液、脑脊液等体液中的细胞外的基因片段,首要来自于坏死或凋亡的肿瘤细胞。ctDNA是癌症的特定标记物,假如能在血液中检查出ctDNA通常就意味着体内有癌症正在发作,这也是癌症早筛的基本原理。

然而,由于ctDNA和由正常细胞发生的游离DNA碎片是混合在一起的,只占一切游离DNA(cell-free DNA,cfDNA)含量的0.1%-1%之间,因而精确检查出ctDNA的难度相当的大。其中所涉及到的信号降噪,降低假阳性、假阴性的发作率等都是难度相当高的科研课题。短网址技术的研发已经到了很成熟的地步。

即便在体液中发现了ctDNA,由于血液循环,ctDNA也许来源于身体的恣意一处,确定肿瘤在体内的成长位置也是另一件高难度的事情。得益于近些年肿瘤基因组测序结果的很多积累,科学家们发现了多种具有安排特异性的踪迹。经过机器学习的途径,联系这些踪迹信息,科学家们就能经过ctDNA来大致判断安排来源。

当然,人工智能的开展并不代表我们可以轻松地解决问题。尽管在现如今,机器学习,乃至深度学习现已拥有了很多开源的算法,哪怕只是一个普通人也可以在一定程度的学习后,运用现有的接口去开发一些简略的模型。可是也正是由于如此,不一样层次的算法人才所做出的产品质量和作用也截然不一样。正如轿车制造的遍及使得人人都可以拥有自个的轿车,可是普通人与赛车手之间车技的距离却依然十分显着。

同样,也由于这是个高度跨学科、常识密集型的范畴,肿瘤早筛的创业团队在机器学习方面的专精程度和对肿瘤病理学的了解致使了产品质量和作用的无穷距离。譬如,由于人类基因组的高度杂乱,和当前二代测序技能依然存在一定的错误,使得数据剖析变成极为要害的一环。团队需求对测序数据的十分熟悉,精通数据挖掘的使用,以及对肿瘤临床常识有精准的了解。


扫描二维码推送至手机访问。

版权声明:本文由短链接发布,如需转载请注明出处。

本文链接:https://www.ft12.com/article_172.html

分享给朋友:

相关文章

一个40岁华为男的自白:作为前IBM员工,除了钱,我为什么要来华为“受虐”

我离开“我摸”(IBM的江湖俗名)加入华为的时候,老板、同事、同学、朋友都十分惊讶的问我为什么。当时总是很装逼的说:“换个环境,我想看看自己的career。”实际上入职后的好几年里,我还在问自己到底为什么来华为。别笑我如此纠结,当年华为的名...

微博开源的Motan RPC最新进展:新增跨语言及服务治理支持

微博开源的Motan RPC最新进展:新增跨语言及服务治理支持

https://github.com/weibocom/motanMotan 是一个基于 Java 开发的高性能的轻量级 RPC 框架,Motan 提供了丰富的服务治理功能和优秀的扩展能力,可以方便的基于 Motan 进行二次开发。Mota...

来自于知乎的干货:人生最重要的三种能力,都不是读书能学来的

  人际交往中的希望值管理才能  应对片面时空歪曲的才能  影视剧中通常有这么的观感:一个地痞或者土匪,素日无恶不作。到了最终一集,哎,这货俄然抗日了,例如《大宅门》里的三爷。  这即是希望值在前期被编剧压低之后的福利。  高兴值 = 现实...

京东年底前将投资泰国,海外扩张野心显性

京东年底前将投资泰国,海外扩张野心显性

【FT12短网址资讯】据路透社报导,京东方案在今年年底曾经对泰国进行投资,扩展海外业务。京东创始人兼CEO刘强东表示,公司方案以泰国为中心,为越南、马来西亚等别的东南亚国家提供服务,但并未透露将对泰国投资金额。近期,京东好像在有意加码东南亚...

短网址在短信移动营销中的应用--移动营销利器

短网址在短信移动营销中的应用--移动营销利器

移动用户越来越多,身边的朋友好多反馈很久没有用过电脑了,每天花大量的时间在玩手机上。因此,越来越多的商家盯上了移动营销这一块大蛋糕。但是,受限于手机屏幕过小,在移动营销中,过长的网址非常影响用户体验,这时候,短网址可以帮到你的大忙。短链接由...

飞来横财:4.6亿购物卡“无人认领” 大润发母公司收归己有

飞来横财:4.6亿购物卡“无人认领” 大润发母公司收归己有

4.6亿“无人认领”的预付卡资金,预计会让高鑫零售交出颇为靓丽的半年报,但资本市场也不太买账。/来源|面包财经(ID:mianbaocaijing) 不少人都会有购物卡,其中就包括超市购物卡。但是,部分人购物卡里的钱可能没用完,甚...

发表评论

访客

◎欢迎参与讨论,请在这里发表您的看法和观点。