欢迎来到建筑考试题库网 建筑考试题库官网
全部科目 > 资格类 > CDA数据分析师 > CDA LEVEL 2大数据分析师

多项选择题

20Newsgroups数据集是机器学习研究中常用的标准数据集,它使用20个Usenet新闻单位上几个月发布的18828个消息,共18828个文件,如果要对该数据集使用mahout进行文本分类,错误的做法是()

    A.直接使用mahout算法,在namenode机器的本地文件系统中调用这18828个文件
    B.将这18828个文件上传到hdfs上,然后使用mahout算法分析
    C.使用mahoutᨀ供的seqdirectory命令将18828个文件序列化成一个大文件上传到hdfs上,然后使用mahout算法分析
    D.将这18828个文件rar压缩软件将其压缩成一个大文件上传到hdfs上,然后使用mahout算法分析

点击查看答案&解析

相关考题

微信小程序免费搜题
微信扫一扫,加关注免费搜题

微信扫一扫,加关注免费搜题