多项选择题
下列哪些命令是Mahout中用于实现贝叶斯文本分类算法()
A.seqdirectory B.seq2sparse C.trainnb D.trainlogistic
多项选择题 下列关于大数据的分析理念的说法中,正确的是()
多项选择题 数据清洗的方法包括()
多项选择题 20Newsgroups数据集是机器学习研究中常用的标准数据集,它使用20个Usenet新闻单位上几个月发布的18828个消息,共18828个文件,如果对该数据集使用mahout进行文本分类,分类后得到的混淆矩阵中,部分结果如下图所示:图中第一行是类别名称,第二行是属于a类的分类情况(a类文本原有168篇),第三行是属于b类的分类情况(b类文本原有180篇),第四行是c类的分类情况(c类文本原有189篇),根据各行的分类情况,以下分析正确的是()