在机器学习中往往需要对数据集做特征工程,单词计数向量和TF-IDF技术是常见的方法,以下内容是由微蓝经验网用户发布机器学习中怎么对文本做特征工程,的那些事儿,希望对于用户有一定帮助,为朋友进行解决疑惑,如若想了解更多相关内容,可以向底部移动了解更多与本教程文章相关解决经验方法!
Jupyter
导入相应的模块。

创建实验数据。

实例化计数向量转化类。

对数据做特征工程,将文本数据进行编码。

编码后的数据类型为稀疏矩阵。

使用接口get_feature_names可以得到所有的特征。

为了更加直观的观察的数据,将稀疏矩阵转换为array。

转换结果。

导入相应的模块。

创建实验数据。

实例化TF-IDF类。

特征工程,将数据进行编码。

编码后的数据类型为稀疏矩阵。

为方便观察数据,将其转化为数组显示。

转换结果。

获取样本是否均衡。






微蓝网部分素材(图片、视频、音频等)来自于网络,不代表本站立场,以上素材或内容仅代表作者个人观点,因此产生相关问题作者本人负责,本站将不承担任何法律责任! 如有问题请进行侵权投诉
© 2025 VLPOS.com 版权所有 微蓝网 ICP备案号:黑ICP备20003952号-1
黑公网安备 23012602000120号