安建福,孟丽莉
AN Jian-fu, MENG Li-li
摘要:
目的 应用神经网络算法提高非编码碱基序列文献的查全率和查准率。方法 从PubMed数据库中选取样本。对样本处理后,应用词频(TF)×逆文档频率(IDF)方法选取特征项,建立基于后向传播(BP)神经网络算法的检索模型。结果 在选取100个特征项时,查准率为91.49%,查全率为71.23%,受试者工作特征曲线下面积(ROC-AUC)为0.823,特异度为93.37%,灵敏度为71.23%,准确率为82.30%。结论 该方法与常用的关键词、MeSH词等方法相比,不仅能够查准也能查全与主题相关的文献。