我正在分块读取一个大文件,并对每个块执行一些操作。在阅读其中一篇文章时,我出现了以下错误:pandas.errors.ParserError: Error tokenizing data. C error: Expected 26 fields in line 15929977, saw 118
这意味着我的一个文件行与其他行的格式不同。我以为我能做的就是省略这一部分,但我没办法做到。我尝试做一个try/except块,如下所示:data = pd.read_table('ny_data_file.txt', sep=',',
header=0, encoding = 'latin1', chunksize = 5000)
try:
for chunk in data:
# operations
except pandas.errors.ParseError:
# Here is my problem
我在这里写的是我的问题是,如果块没有被很好地解析,我的代码将自动转到异常,甚至不会进入for循环,但我希望跳过这个块,并前进到下一个块,我希望在下一个块上执行循环内的操作。在
我已经检查了stackoverflow,但在for循环中找不到类似的尝试。任何帮助都将不胜感激。在
更新:
我试着按照评论中的建议去做:
^{pr2}$
但是仍然没有覆盖异常,因为正如前面所说,异常是在从数据中获取chyunk时创建的,而不是在对其进行操作时创建的。在