You are viewing a plain text version of this content. The canonical link for it is here.
Posted to user-zh@flink.apache.org by 胡凌瑞 <hu...@gmail.com> on 2022/08/09 16:35:07 UTC

关于flink读取csv文件问题

你好,我有一个CSV文件在附件中,我通过flink读取csv文件,已经按照CSV文件的格式创建了对应的POJO,然后使用PojoCsvInputFormat来解析他,这里是我的代码
[image: image.png]

这里有个问题是,我的CSV文件的第二行的title里,双引号里有两个逗号,flink就无法正确读取这个csv文件并会exception,如果我把第二行里的逗号删掉,就可以正常运行,可以看看是不是因为csv文件解析导致的吗,或者说是我的使用方法不当。

十分感谢!

Re: 关于flink读取csv文件问题

Posted by Weihua Hu <hu...@gmail.com>.
Hi,

 CSVInputFormat 默认没有考虑引号,会直接按照 ',' 分割单行。可以尝试在解析 csv 时指定双引号

csvInputFormat.enableQuotedStringParsing('"');


Best,
Weihua


On Wed, Aug 10, 2022 at 9:40 AM 胡凌瑞 <hu...@gmail.com> wrote:

>
> 你好,我有一个CSV文件在附件中,我通过flink读取csv文件,已经按照CSV文件的格式创建了对应的POJO,然后使用PojoCsvInputFormat来解析他,这里是我的代码
> [image: image.png]
>
>
> 这里有个问题是,我的CSV文件的第二行的title里,双引号里有两个逗号,flink就无法正确读取这个csv文件并会exception,如果我把第二行里的逗号删掉,就可以正常运行,可以看看是不是因为csv文件解析导致的吗,或者说是我的使用方法不当。
>
> 十分感谢!
>