新闻资讯
品牌信息
- Zeiss
- ThermoFisher
行业动态
行业动态
PNAS:一种数据集分析技术可识别从生物信息学到语言学等领域
添加时间:

201442


对大数据集的自动分析可能识别出数据的模式,但是无法评估发现的模式的显著性,这可能导致无意义的结果。Claudio Luchinat及其同事发展了一种数据分析方法,它包括了一个交叉验证步骤,从而识别出显著的模式,这种方法称为通过准确性的知识发现(KODAMA)

一个迭代过程评估了对数据的可能的分类,从而对尽可能多的数据点进行归类,并且通过合并类似的数据类,削减可能的数据类的数量。最后,定义了一个相异度矩阵从而评估数据点之间的关系。这组作者把通过准确性最大化的知识发现(KODAMA)应用到了几个数据集上,包括淋巴瘤遗传学、代谢组学和上溯到1900年的美国国情咨文的语言学特征。


对于国情咨文,这组作者报告说通过准确性的知识发现(KODAMA)揭示出了在罗纳德里根总统任期期间的一种转变,诸如劳动生产开支等词汇的频率减少,而诸如父母子女改革等词汇的频率增加。这组作者说,这些结果提示通过准确性的知识发现(KODAMA)可能有能力从有噪声或复杂的数据集中提取出有意义的模式。








扫描加关注
Zeiss产品
技术园地
下载中心
Zeiss产品
品牌信息
行业动态
公司简介
公司新闻
企业文化
人才招聘
联系我们
Copyright © 2014 njwfd.com All rights reserved. 南京微弗德科学仪器有限公司版权所有 版权所有 苏ICP备18013608号 后台管理 | 技术支持:智拓网络