600字范文,内容丰富有趣,生活中的好帮手!
600字范文 > NLTK异常问题 [nltk_data] Error loading reuters: <urlopen error [Errno 11004] [nltk_data] getaddrinfo

NLTK异常问题 [nltk_data] Error loading reuters: <urlopen error [Errno 11004] [nltk_data] getaddrinfo

时间:2019-02-02 21:34:13

相关推荐

NLTK异常问题 [nltk_data] Error loading reuters: <urlopen error [Errno 11004] [nltk_data] getaddrinfo

[nltk_data] Error loading reuters: urlopen error [Errno 11004] [nltk_data] getaddrinfo failed

解决办法1.设置系统代理2.修改host文件3.手动下载后解压到指定目录操作步骤

在学习NLP项目时,经常会用到nltk工具包,但经常在import后使用的时候出现报错的情况

我们可以看到在错误提示里有让我们去download(‘reuters’)

但是按照提示的方法去下载时会报如下错误

import nltknltk.download('reuters')

出现这样的问题时要怎么解决?很多人都走错了思路导致浪费了不少时间在这上面。

主要的原因是无法解析这个域名,这时我们可以使用代理的方式去连接到这个地址,或者修改host文件的域名地址映射,或者手动下载后解压到指定目录,详情如下:

解决办法

1.设置系统代理

把nltk.download()替换为:

nltk.set_proxy('SYSTEM PROXY')nltk.download()

2.修改host文件

在 C:\Windows\System32\drivers\etc 路径下找到hosts文件,并在最后添加 199.232.68.133 IP地址,并保存(注意:使用管理员打开)。这时再打开NLTK下载器,便可以正常打开。如图:

这里199.232.68.133 中,前面的IP地址可能会发生更换,可以使用域名查看器(如:/)查询的IP地址后再修改hosts文件。

得到 199.232.68.133 的IP地址,这时修改按上一步修改hosts文件就可以了

可能存在部分朋友按照方法1仍不可行(没有任何反应,此时也不报错了,但是就是不下载)的情况,那么请看方法2吧

3.手动下载后解压到指定目录

可以点击下面两个链接,手动下载nltk_data包

注意:nltk_data:github国内访问比较慢,如果访问失败的话可以使用第二个gitcode的链接(国内更快一些)

nltk_data:github

nltk_data:gitcode

操作步骤

下载解压在提示搜索的目录里创建nltk_data文件夹

Searched in:- 'C:\\User\\Administrator/nltk_data'- 'D:\\ProgramData\\Anaconda3\\nltk_data'- 'D:\\ProgramData\\Anaconda3\\Lib\\nltk_data'- .....

路径很多,随意选择一个即可

将解压后的packages下的所有文件copy到刚才新建的nltk_data文件夹下

5.重启jupyter notebook即可(如果使用的是jupyter notebook工具:一般需要关闭jupyter notebook重新打开才生效)

引用参考:

[1]: https://mp./s?__biz=MzI1NzczMDIwNw==&mid=2247483777&idx=1&sn=cd985f3f7fe0472df9560de94753d86d&chksm=ea13b271dd643b67a591485d249ca9f64aaa380db3ff16c462c0d2def5ccce114e3c938b955e&token=445308227&lang=zh_CN#rd[2]: /zeroheitao/article/details/122496837

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。