参考:/liu16659/article/details/109691534
最近想做一个NLP的数据增强,于是找到了
EDA: Easy Data Augmentation Techniques for Boosting Performance on Text Classification Tasks
代码地址
/jasonwei20/eda_nlp
但是,需要nltk库,我直接
pip install -U nltk
然后按照其方式运行
python code/augment.py --input=<insert input filename>
发现出现了错误,提示我要安装wordnet包
import nltknltk.download('wordnet')
但是,出现了如下错误:
nltk安装Wordnet出错[nltk_data] Error loading wordnet: <urlopen error [Errno 111]
我尝试了很多方法,最终得到了如下结论:
1.首先去官网下载对应的包
/nltk_data/
2.然后去github下载nltk_data文件
/nltk/nltk_data
这里下载好之后要改文件名为 nltk_data
3.把nltk_data放入对应的文件夹中,我是直接放在了 /home/你的用户名/nltk_data
我是linux下的anaconda环境,不知道放在anaconda的环境里面行不行
4.在nltk_data文件中创建corpora文件,并且将步骤1中下载的包(这里一定要是.zip形式的,比如把wordnex.zip放入corpora文件中)放入corpora文件。
5.再次尝试
python code/augment.py --input=<insert input filename>
发现解决了问题。