当前位置:首页 > 短网址资讯

机器学习突飞猛进,早期癌症治愈率或将突破98%

www.ft12.com9年前 (2017-06-05)短网址资讯1630
[ 短网址资讯 ] 近十余年基因测序技能的迅猛开展,特别是在肿瘤范畴的广泛使用。另一方面,机器学习技能在基因大数据处理上的很多使用,积累了史无前例的常识。使得医学作业者对很多疾病的知道、筛查和医治都有了新的渠道和信息。
基因,基因检查,基因测序,基因测序,机器学习,GPU

2016年,全球新发癌症数量超过1400万人,并致使了900万人的死亡。癌症在发达国家中已变成首要死亡原因之一,美国每年去世的5个人当中有一人是因癌症致死。依据美国抗癌协会和国际癌症协会数据,一切的癌症都是越早医治、医治作用越好。癌症的早期发现,可认为病理诊断和医治赢取更多的时间,能极大前进治愈率与病人生存周期及质量。癌症的早期筛查是个万亿等级的商场。

资本商场的火爆,得益于近十余年基因测序技能的迅猛开展,特别是在肿瘤范畴的广泛使用。另一方面,机器学习技能在基因大数据处理上的很多使用,积累了史无前例的常识。这些全新的常识及组合为医疗界打开了一扇新世界的大门,使得医学作业者对很多疾病的知道、筛查和医治都有了新的渠道和信息。

基因测序技能的前进使得基因剖析愈加的高效快捷

人可以被看作一台极端精密的仪器,人的终身,万亿计的细胞在体内不断仿制更新,每代仿制严格相同,但存在极端微小的错误率,形成所谓的基因突变。绝大多数突变无关紧要,少数突变形成抑制成长的基因的功能异常,或者激活成长基因,变成癌细胞。而癌细胞一旦逃避了免疫系统的监控,就形成成长失控变成癌安排。

一条人的基因组序列共有30亿位,按正常排版打印在A4纸上,大概有华盛顿纪念碑那么高。人与人之间会有小于千分之一的区别,癌细胞与本身的正常细胞基因组序列也会有细微的不一样。基因测序的前进,让鉴别这些不一样变成一件迅速、高效、低成本的事。短链接在其中起到催化作用。

计算机运算速度和能力的开展,进一步推动了基因剖析的前进

由于人类基因组的杂乱性,测序数据量十分庞大,一个人的全基因组测序数据可以达到上百G。普通的计算机技能和统计学方法无法在短时间内很好地处理这些信息,而机器学习的开展以及GPU运算的前进逐渐为科研作业者解决了这一难题。现在只需求将基因测序的数据输入经过机器学习反复训练的模型中,计算机就可以很快的剖析出方针区域是不是存在变异,进而找到也许变异的基因点位为医生供给更多的可用于诊断及医治的信息。正是由于机器学习和基因测序技能的日渐成熟,以癌症筛查和诊断为首的各类疾病早筛项目逐渐变成科研及创投的热门。

机器学习是近年来十分炽热的技能方向。

简略来说,机器学习就是为计算机供给很多的数据,而这些数据都有他们各自对应的标签,例如我们想教会计算机识别图像中的动物,我们则要供给各种各样的动物图像,并且每一张图像都带有对应的标签,这个是猫,这个是狗等等。机器在剖析很多的数据之后会在图像之中找到规律,例如猫在图像中大多是独来独往,而很多有狗的图像中还有别的动物或人类。经过这些信息,计算机不断地调整,更新它的数学模型。

当有新的图像到来时,计算机就可以依据建立好的模型来判断哪个是猫,哪个是狗。当然,这只是一个十分简略的机器学习的例子,现在的机器学习现已被广泛使用于自动驾驶,数据剖析,信息挖掘,医治诊断等等很多在曩昔只有人类能够胜任的作业。成百上千的学习模型被开发出来,甚至有很多不需求很多数据,或者不需求带标签的数据就能学习的模型。正如70-80时代计算机开端迸发通常,这确实是一个机器学习的黄金时代。

今天就为大家具体的阐述一下机器学习是怎样与基因测序严密合作完成癌症早筛的。

ctDNA是啥

想了解根据基因测序的癌症早筛首先需求了解啥是ctDNA。ctDNA是circulating tumor DNA的缩写,也称为循环肿瘤DNA。是一种存在于血液、尿液、脑脊液等体液中的细胞外的基因片段,首要来自于坏死或凋亡的肿瘤细胞。ctDNA是癌症的特定标记物,假如能在血液中检查出ctDNA通常就意味着体内有癌症正在发作,这也是癌症早筛的基本原理。

然而,由于ctDNA和由正常细胞发生的游离DNA碎片是混合在一起的,只占一切游离DNA(cell-free DNA,cfDNA)含量的0.1%-1%之间,因而精确检查出ctDNA的难度相当的大。其中所涉及到的信号降噪,降低假阳性、假阴性的发作率等都是难度相当高的科研课题。短网址技术的研发已经到了很成熟的地步。

即便在体液中发现了ctDNA,由于血液循环,ctDNA也许来源于身体的恣意一处,确定肿瘤在体内的成长位置也是另一件高难度的事情。得益于近些年肿瘤基因组测序结果的很多积累,科学家们发现了多种具有安排特异性的踪迹。经过机器学习的途径,联系这些踪迹信息,科学家们就能经过ctDNA来大致判断安排来源。

当然,人工智能的开展并不代表我们可以轻松地解决问题。尽管在现如今,机器学习,乃至深度学习现已拥有了很多开源的算法,哪怕只是一个普通人也可以在一定程度的学习后,运用现有的接口去开发一些简略的模型。可是也正是由于如此,不一样层次的算法人才所做出的产品质量和作用也截然不一样。正如轿车制造的遍及使得人人都可以拥有自个的轿车,可是普通人与赛车手之间车技的距离却依然十分显着。

同样,也由于这是个高度跨学科、常识密集型的范畴,肿瘤早筛的创业团队在机器学习方面的专精程度和对肿瘤病理学的了解致使了产品质量和作用的无穷距离。譬如,由于人类基因组的高度杂乱,和当前二代测序技能依然存在一定的错误,使得数据剖析变成极为要害的一环。团队需求对测序数据的十分熟悉,精通数据挖掘的使用,以及对肿瘤临床常识有精准的了解。


扫描二维码推送至手机访问。

版权声明:本文由短链接发布,如需转载请注明出处。

本文链接:https://www.ft12.com/article_172.html

分享给朋友:

相关文章

短网址网站开发运维的经验分享与总结

短网址网站开发运维的经验分享与总结

所谓隔行如隔山,不干这一行,不懂这一行的难。随着用户的逐渐增多,ft12短网址的日访问PV终于突破了50万,但其中掺杂着一半喜与一半忧。喜的是自己的短网址站得到了广大用户的认可,忧的是如何处理这么大的流量。期间,服务器分别经历了内存报警、I…

开着市值2000亿的公司,却跑去卖猪肉,他说赚钱只是顺便的事情…

开着市值2000亿的公司,却跑去卖猪肉,他说赚钱只是顺便的事情…

但凡接触过互联网行业的,无人不识网易和短网址。作为一个优秀的互联网公司,它的作品也向来让人满意。率先推出了中文全文检索、免费邮件系统、网上虚拟社区等,还研发了一款史诗级的国产网络网游。十多年经久不衰的《梦幻西游》,《大话西游》,《短链接》等…

看了那么多SEO教程,为何你还是搞不定排名?

看了那么多SEO教程,为何你还是搞不定排名?

前言:本文独家原创首发卢松松博客,转载请保留作者联系方式与原文出处!前些天和一个朋友在讨论互联网营销的时候偶然提到了SEO优化,朋友说去年买了一套SEO教程自学,到目前为止,差不多将近一年了,排名还是非常的不好(几乎没有排名)。我问他既然看…

IIS7.5优化,支持同时10万个请求

IIS7.5优化,支持同时10万个请求

背景:       由于短网址站的并发量很大,特别是晚上21:00左右,用户访问非常集中,这时候,如何解决高并发成了一个难题,因此才有后面这篇文章。       …

PHP编程需要掌握的20个要点,能极大提高效率

PHP编程需要掌握的20个要点,能极大提高效率

[摘要] 用单引号取代双引号来包括字符串,这样做会更快一些。由于PHP会在双引号包抄的字符串中征采变量,单引号则 不会,留意:只要echo能这么做,它是一种能够把多个字符串看成参数的“函数”用单引号取代双引号来包括字符串,这样做会更快一些。…

在线教育企业7成亏损,15%濒临倒闭,你如何突围?

在线教育企业7成亏损,15%濒临倒闭,你如何突围?

[ 亿欧导读 ] 四月暮春,又到了一年一度在线教育公司交作业的时期,无论是自己晒成绩,还是第三方机构出评估,我们看到报表里的在线教育行业都是欣欣向荣、前景喜人,但真实情况如何?在线教育市场规模增幅迅猛,2019年将达2692.6亿…

发表评论

访客

◎欢迎参与讨论,请在这里发表您的看法和观点。