You are viewing a plain text version of this content. The canonical link for it is here.
Posted to user-zh@flink.apache.org by 胡凌瑞 <hu...@gmail.com> on 2022/08/09 16:35:07 UTC
关于flink读取csv文件问题
你好,我有一个CSV文件在附件中,我通过flink读取csv文件,已经按照CSV文件的格式创建了对应的POJO,然后使用PojoCsvInputFormat来解析他,这里是我的代码
[image: image.png]
这里有个问题是,我的CSV文件的第二行的title里,双引号里有两个逗号,flink就无法正确读取这个csv文件并会exception,如果我把第二行里的逗号删掉,就可以正常运行,可以看看是不是因为csv文件解析导致的吗,或者说是我的使用方法不当。
十分感谢!
Re: 关于flink读取csv文件问题
Posted by Weihua Hu <hu...@gmail.com>.
Hi,
CSVInputFormat 默认没有考虑引号,会直接按照 ',' 分割单行。可以尝试在解析 csv 时指定双引号
csvInputFormat.enableQuotedStringParsing('"');
Best,
Weihua
On Wed, Aug 10, 2022 at 9:40 AM 胡凌瑞 <hu...@gmail.com> wrote:
>
> 你好,我有一个CSV文件在附件中,我通过flink读取csv文件,已经按照CSV文件的格式创建了对应的POJO,然后使用PojoCsvInputFormat来解析他,这里是我的代码
> [image: image.png]
>
>
> 这里有个问题是,我的CSV文件的第二行的title里,双引号里有两个逗号,flink就无法正确读取这个csv文件并会exception,如果我把第二行里的逗号删掉,就可以正常运行,可以看看是不是因为csv文件解析导致的吗,或者说是我的使用方法不当。
>
> 十分感谢!
>