SVM-RFE机器学习算法进行两组分类的特征筛选
简介
支持向量机递归特征消除,是一种基于Embedded的机器学习算法,适用于对两分类数据进行特征提取。调用John Colby教授所写的mSVM-REF函数。默认使用全部特征进行计算
输入
矩阵形式,第1列是样品名(必需唯一),第2列是组名(建议:有意义的组名,例如high 和 low,不要用纯数字,特殊符号等);第3+列为特征(例如基因及表达值,甲基化beta值等)。默认10折交叉验证,随机因子12345
输出为:特征权重表格(avgRank越低表示基因始终排名靠前,可能是核心基因),预测准确性折线图(越大越好,最大处对应的X轴数值为要挑选的最优特征子集数),预测错误值折线图(越小越好)。
如何引用?
建议直接写网址。助力发表6400+篇
(google学术),5600+篇
(知网)论文
正式引用:Tang D, Chen M, Huang X, Zhang G, Zeng L, Zhang G, Wu S, Wang Y.
SRplot: A free online platform for data visualization and graphing. PLoS One. 2023 Nov 9;18(11):e0294236. doi: 10.1371/journal.pone.0294236. PMID: 37943830.
方法章节:Heatmap was plotted by https://www.bioinformatics.com.cn (last accessed on 10 Dec 2024), an online platform for data analysis and visualization.
致谢章节:We thank Mingjie Chen (Shanghai NewCore Biotechnology Co., Ltd.) for providing data analysis and visualization support.