为解决高维数据集导致的分类器计算复杂度高、冗余特征干扰等问题,研究人员提出基于马氏距离(Mahalanobis distance)的特征选择方法,应用于帕金森病(PD)语音数据集。通过筛选与数据集协方差结构相关的收敛特征,将特征维度分别从22和45降至11和18,使KNN和 ...
我们常说机器学习三大件:模型、损失函数、优化算法。 模型:线性回归、逻辑回归、SVM、CNN、RNN、LSTM、Transformer等等。 损失函数:均方误差、交叉熵、对比损失。 优化算法:梯度下降、Adam、RMSProp、牛顿法等等。 其中损失函数通过衡量模型预测值和真实值 ...
说明:如果访问 GitHub 比较慢的话,可以关注我的知乎账号(Python-Jack),上面的“从零开始学Python”专栏(对应本项目前 20 天的内容)比较适合初学者,其他的专栏如“数据思维和统计思维”、“基于Python的数据分析”、“说走就走的AI之旅”等也在持续更新中 ...
上图为 2018 年 4 月在杭州阿里中心听 Michael Jordan 讲座时所摄,他本人也是 distance metric learning 研究的开山鼻祖之一。当时只知大佬名气、不知大佬风范,现如今读起文章来,才觉得很幸运曾经有过的时空上的交集,希望以后能努力做好自己的研究。 在机器学习中 ...
在仿制药一致性评价开发过程中,我们经常会遇到参比制剂或自研制剂的批内差异较大,不能满足第1个时间点溶出结果的相对 ...