You are viewing a plain text version of this content. The canonical link for it is here.
Posted to users@pdfbox.apache.org by Eugster Christian BB_SK <ch...@stadt.sg.ch> on 2015/01/30 10:45:45 UTC

NullPointerException while validating PDF/A files

Hi ,
previously I searched in the web for this issue but did not find anything about it.
I am using pdfbox to validate pdf/a files. There are 265 files to validate, most of them passed without problems. On 7 files however validating throws a nullpointerexception. The place where this exception is thrown within pdfbox is  org.apache.pdfbox.util.PDFStreamEngine. processSubStream(PDPage aPage, PDResources resources, COSStream cosStream) throws IOException within the finally clause where streamResourcesStack.pop().clear() is done. Because I have no chance to go further due to extremely restricted authorizations I can not say more about it. The files in question are generated by Microsoft Office 2010 without protection. The content of the files has informations about persons and I am not allowed to distribute them.

Does anybody know about this and what could be the problem? What am I to do to avoid this problem? Do you need any further information? Thanks for any response!

Freundliche Grüsse
Christian Eugster

Stadtkanzlei l Stadt St.Gallen l Rathaus l 9001 St.Gallen
Tel +41 71 224 XX XX l christian.eugster@stadt.sg.ch<ma...@stadt.sg.ch> l www.stadt.sg.ch<http://www.stadt.sg.ch/>
Erreichbarkeit: jeweils Do und Fr der zweiten Monatshälfte.


________________________________

Hinweis: Diese Mitteilung ist ausschliesslich für die als Adressaten bezeichneten Personen bestimmt. Sie kann vertrauliche und rechtlich geschützte Informationen enthalten. Sollten Sie diese Mitteilung irrtümlich erhalten haben, bitten wir Sie, uns unverzüglich zu benachrichtigen und diese Mitteilung zu löschen. Das unerlaubte Kopieren sowie die unbefugte Weitergabe dieses E-Mails ist nicht gestattet. Besten Dank.

AW: NullPointerException while validating PDF/A files

Posted by Eugster Christian BB_SK <ch...@stadt.sg.ch>.
Hi Mariun,

I am back now. Stupidly I have no opportunity to download the 2.0 version of pdfbox preflight, due to user authorization restrictions. I shall download it at home and then try it out. You will hear from me.

Christian


-----Ursprüngliche Nachricht-----
Von: Maruan Sahyoun [mailto:sahyoun@fileaffairs.de]
Gesendet: Freitag, 30. Januar 2015 12:29
An: users@pdfbox.apache.org
Betreff: Re: NullPointerException while validating PDF/A files

Hi Christian,

I'm looking forward to your feedback.

With kind regards

Maruan

Am 30.01.2015 um 12:00 schrieb Eugster Christian BB_SK <ch...@stadt.sg.ch>:

> Hi Maruan,
>
> I shall try it with the versions you proposed. It will take some time, because I shall work in the second half of February, but I shall inform you about the results. Thank you very much!
>
> Christian
>
> -----Ursprüngliche Nachricht-----
> Von: Maruan Sahyoun [mailto:sahyoun@fileaffairs.de]
> Gesendet: Freitag, 30. Januar 2015 11:24
> An: users@pdfbox.apache.org
> Betreff: Re: NullPointerException while validating PDF/A files
>
> Hi Christian,
>
> would it be an option to test with the 1.8.9 and 2.0.0 Snapshot builds [https://repository.apache.org/content/groups/snapshots/org/apache/pdfbox/preflight-app/] to see if the issue has been resolved lately (there were some enhancements to parsing, preflight and especially with 2.0 for font handling)?
>
> If that issue hasn't been addressed we would need a sample file to reproduce the issue. If the data is confidential there is the option to pass it to one of the committers privately. The other option would be to decode the pdf inspect the portion where it's failing and copy that PDF portion.
>
> BR
>
> Maruan
>
>
> Am 30.01.2015 um 10:59 schrieb Eugster Christian BB_SK <ch...@stadt.sg.ch>:
>
>> Dear Maruan,
>>
>> Wow, that was fast...
>>
>> Yes, it is version 1.8.8 and the stacktrace I get is:
>>
>> 10:58:25.668 [main] DEBUG org.apache.pdfbox.util.PDFStreamEngine -
>> processing substream token: PDFOperator{TJ} java.lang.NullPointerException
>>       at org.apache.pdfbox.pdmodel.font.PDType0Font.getFontWidth(PDType0Font.java:188)
>>       at org.apache.pdfbox.preflight.font.container.FontContainer.checkGlyphWith(FontContainer.java:114)
>>       at org.apache.pdfbox.preflight.content.ContentStreamWrapper.validText(ContentStreamWrapper.java:372)
>>       at org.apache.pdfbox.preflight.content.ContentStreamWrapper.validStringArray(ContentStreamWrapper.java:296)
>>       at org.apache.pdfbox.preflight.content.ContentStreamWrapper.validStringArray(ContentStreamWrapper.java:292)
>>       at org.apache.pdfbox.preflight.content.ContentStreamWrapper.checkShowTextOperators(ContentStreamWrapper.java:208)
>>       at org.apache.pdfbox.preflight.content.ContentStreamWrapper.processOperator(ContentStreamWrapper.java:180)
>>       at org.apache.pdfbox.util.PDFStreamEngine.processSubStream(PDFStreamEngine.java:268)
>>       at org.apache.pdfbox.util.PDFStreamEngine.processSubStream(PDFStreamEngine.java:235)
>>       at org.apache.pdfbox.util.PDFStreamEngine.processStream(PDFStreamEngine.java:215)
>>       at org.apache.pdfbox.preflight.content.ContentStreamWrapper.validPageContentStream(ContentStreamWrapper.java:75)
>>       at org.apache.pdfbox.preflight.process.reflect.SinglePageValidationProcess.validateContent(SinglePageValidationProcess.java:179)
>>       at org.apache.pdfbox.preflight.process.reflect.SinglePageValidationProcess.validate(SinglePageValidationProcess.java:87)
>>       at org.apache.pdfbox.preflight.utils.ContextHelper.callValidation(ContextHelper.java:81)
>>       at org.apache.pdfbox.preflight.utils.ContextHelper.validateElement(ContextHelper.java:54)
>>       at org.apache.pdfbox.preflight.process.PageTreeValidationProcess.validatePage(PageTreeValidationProcess.java:58)
>>       at org.apache.pdfbox.preflight.process.PageTreeValidationProcess.validate(PageTreeValidationProcess.java:47)
>>       at org.apache.pdfbox.preflight.utils.ContextHelper.callValidation(ContextHelper.java:81)
>>       at org.apache.pdfbox.preflight.utils.ContextHelper.validateElement(ContextHelper.java:96)
>>       at org.apache.pdfbox.preflight.PreflightDocument.validate(PreflightDocument.java:168)
>>       at ch.eugster.pdfa.validation.PdfaValidator.validateFile(PdfaValidator.java:198)
>>       at ch.eugster.pdfa.validation.PdfaValidator.validate(PdfaValidator.java:105)
>>       at ch.eugster.pdfa.validation.PdfaValidator.validate(PdfaValidator.java:97)
>>       at ch.eugster.pdfa.validation.PdfaValidator.<init>(PdfaValidator.java:77)
>>       at
>> ch.eugster.pdfa.validation.PdfaValidator.main(PdfaValidator.java:39)
>>
>> Christian
>>
>> -----Ursprüngliche Nachricht-----
>> Von: Maruan Sahyoun [mailto:sahyoun@fileaffairs.de]
>> Gesendet: Freitag, 30. Januar 2015 10:55
>> An: users@pdfbox.apache.org
>> Betreff: Re: NullPointerException while validating PDF/A files
>>
>> Dear Christian,
>>
>> which version of PDFBox are you using? Could you provide a full stack trace?
>>
>> BR
>>
>> Maruan Sahyoun
>>
>> FileAffairs GmbH
>> Josef-Schappe-Straße 21
>> 40882 Ratingen
>>
>> Tel: +49 (2102) 89497 88
>> Fax: +49 (2102) 89497 91
>> sahyoun@fileaffairs.de
>> www.fileaffairs.de
>>
>> Geschäftsführer: Maruan Sahyoun
>> Handelsregister: AG Düsseldorf, HRB 53837
>> UST.-ID: DE248275827
>>
>> Am 30.01.2015 um 10:45 schrieb Eugster Christian BB_SK <ch...@stadt.sg.ch>:
>>
>>> Hi ,
>>> previously I searched in the web for this issue but did not find anything about it.
>>> I am using pdfbox to validate pdf/a files. There are 265 files to validate, most of them passed without problems. On 7 files however validating throws a nullpointerexception. The place where this exception is thrown within pdfbox is  org.apache.pdfbox.util.PDFStreamEngine. processSubStream(PDPage aPage, PDResources resources, COSStream cosStream) throws IOException within the finally clause where streamResourcesStack.pop().clear() is done. Because I have no chance to go further due to extremely restricted authorizations I can not say more about it. The files in question are generated by Microsoft Office 2010 without protection. The content of the files has informations about persons and I am not allowed to distribute them.
>>>
>>> Does anybody know about this and what could be the problem? What am I to do to avoid this problem? Do you need any further information? Thanks for any response!
>>>
>>> Freundliche Grüsse
>>> Christian Eugster
>>>
>>> Stadtkanzlei l Stadt St.Gallen l Rathaus l 9001 St.Gallen Tel +41 71
>>> 224 XX XX l
>>> christian.eugster@stadt.sg.ch<ma...@stadt.sg.ch>
>>> l www.stadt.sg.ch<http://www.stadt.sg.ch/>
>>> Erreichbarkeit: jeweils Do und Fr der zweiten Monatshälfte.
>>>
>>>
>>> ________________________________
>>>
>>> Hinweis: Diese Mitteilung ist ausschliesslich für die als Adressaten bezeichneten Personen bestimmt. Sie kann vertrauliche und rechtlich geschützte Informationen enthalten. Sollten Sie diese Mitteilung irrtümlich erhalten haben, bitten wir Sie, uns unverzüglich zu benachrichtigen und diese Mitteilung zu löschen. Das unerlaubte Kopieren sowie die unbefugte Weitergabe dieses E-Mails ist nicht gestattet. Besten Dank.
>>
>>
>> ________________________________
>>
>> Hinweis: Diese Mitteilung ist ausschliesslich für die als Adressaten bezeichneten Personen bestimmt. Sie kann vertrauliche und rechtlich geschützte Informationen enthalten. Sollten Sie diese Mitteilung irrtümlich erhalten haben, bitten wir Sie, uns unverzüglich zu benachrichtigen und diese Mitteilung zu löschen. Das unerlaubte Kopieren sowie die unbefugte Weitergabe dieses E-Mails ist nicht gestattet. Besten Dank.
>>
>> ---------------------------------------------------------------------
>> To unsubscribe, e-mail: users-unsubscribe@pdfbox.apache.org
>> For additional commands, e-mail: users-help@pdfbox.apache.org
>>
>
>
> ________________________________
>
> Hinweis: Diese Mitteilung ist ausschliesslich für die als Adressaten bezeichneten Personen bestimmt. Sie kann vertrauliche und rechtlich geschützte Informationen enthalten. Sollten Sie diese Mitteilung irrtümlich erhalten haben, bitten wir Sie, uns unverzüglich zu benachrichtigen und diese Mitteilung zu löschen. Das unerlaubte Kopieren sowie die unbefugte Weitergabe dieses E-Mails ist nicht gestattet. Besten Dank.
>
> ---------------------------------------------------------------------
> To unsubscribe, e-mail: users-unsubscribe@pdfbox.apache.org
> For additional commands, e-mail: users-help@pdfbox.apache.org
>


________________________________

Hinweis: Diese Mitteilung ist ausschliesslich für die als Adressaten bezeichneten Personen bestimmt. Sie kann vertrauliche und rechtlich geschützte Informationen enthalten. Sollten Sie diese Mitteilung irrtümlich erhalten haben, bitten wir Sie, uns unverzüglich zu benachrichtigen und diese Mitteilung zu löschen. Das unerlaubte Kopieren sowie die unbefugte Weitergabe dieses E-Mails ist nicht gestattet. Besten Dank.

---------------------------------------------------------------------
To unsubscribe, e-mail: users-unsubscribe@pdfbox.apache.org
For additional commands, e-mail: users-help@pdfbox.apache.org


Re: NullPointerException while validating PDF/A files

Posted by Maruan Sahyoun <sa...@fileaffairs.de>.
Hi Christian,

I'm looking forward to your feedback.

With kind regards

Maruan

Am 30.01.2015 um 12:00 schrieb Eugster Christian BB_SK <ch...@stadt.sg.ch>:

> Hi Maruan,
> 
> I shall try it with the versions you proposed. It will take some time, because I shall work in the second half of February, but I shall inform you about the results. Thank you very much!
> 
> Christian
> 
> -----Ursprüngliche Nachricht-----
> Von: Maruan Sahyoun [mailto:sahyoun@fileaffairs.de]
> Gesendet: Freitag, 30. Januar 2015 11:24
> An: users@pdfbox.apache.org
> Betreff: Re: NullPointerException while validating PDF/A files
> 
> Hi Christian,
> 
> would it be an option to test with the 1.8.9 and 2.0.0 Snapshot builds [https://repository.apache.org/content/groups/snapshots/org/apache/pdfbox/preflight-app/] to see if the issue has been resolved lately (there were some enhancements to parsing, preflight and especially with 2.0 for font handling)?
> 
> If that issue hasn't been addressed we would need a sample file to reproduce the issue. If the data is confidential there is the option to pass it to one of the committers privately. The other option would be to decode the pdf inspect the portion where it's failing and copy that PDF portion.
> 
> BR
> 
> Maruan
> 
> 
> Am 30.01.2015 um 10:59 schrieb Eugster Christian BB_SK <ch...@stadt.sg.ch>:
> 
>> Dear Maruan,
>> 
>> Wow, that was fast...
>> 
>> Yes, it is version 1.8.8 and the stacktrace I get is:
>> 
>> 10:58:25.668 [main] DEBUG org.apache.pdfbox.util.PDFStreamEngine -
>> processing substream token: PDFOperator{TJ} java.lang.NullPointerException
>>       at org.apache.pdfbox.pdmodel.font.PDType0Font.getFontWidth(PDType0Font.java:188)
>>       at org.apache.pdfbox.preflight.font.container.FontContainer.checkGlyphWith(FontContainer.java:114)
>>       at org.apache.pdfbox.preflight.content.ContentStreamWrapper.validText(ContentStreamWrapper.java:372)
>>       at org.apache.pdfbox.preflight.content.ContentStreamWrapper.validStringArray(ContentStreamWrapper.java:296)
>>       at org.apache.pdfbox.preflight.content.ContentStreamWrapper.validStringArray(ContentStreamWrapper.java:292)
>>       at org.apache.pdfbox.preflight.content.ContentStreamWrapper.checkShowTextOperators(ContentStreamWrapper.java:208)
>>       at org.apache.pdfbox.preflight.content.ContentStreamWrapper.processOperator(ContentStreamWrapper.java:180)
>>       at org.apache.pdfbox.util.PDFStreamEngine.processSubStream(PDFStreamEngine.java:268)
>>       at org.apache.pdfbox.util.PDFStreamEngine.processSubStream(PDFStreamEngine.java:235)
>>       at org.apache.pdfbox.util.PDFStreamEngine.processStream(PDFStreamEngine.java:215)
>>       at org.apache.pdfbox.preflight.content.ContentStreamWrapper.validPageContentStream(ContentStreamWrapper.java:75)
>>       at org.apache.pdfbox.preflight.process.reflect.SinglePageValidationProcess.validateContent(SinglePageValidationProcess.java:179)
>>       at org.apache.pdfbox.preflight.process.reflect.SinglePageValidationProcess.validate(SinglePageValidationProcess.java:87)
>>       at org.apache.pdfbox.preflight.utils.ContextHelper.callValidation(ContextHelper.java:81)
>>       at org.apache.pdfbox.preflight.utils.ContextHelper.validateElement(ContextHelper.java:54)
>>       at org.apache.pdfbox.preflight.process.PageTreeValidationProcess.validatePage(PageTreeValidationProcess.java:58)
>>       at org.apache.pdfbox.preflight.process.PageTreeValidationProcess.validate(PageTreeValidationProcess.java:47)
>>       at org.apache.pdfbox.preflight.utils.ContextHelper.callValidation(ContextHelper.java:81)
>>       at org.apache.pdfbox.preflight.utils.ContextHelper.validateElement(ContextHelper.java:96)
>>       at org.apache.pdfbox.preflight.PreflightDocument.validate(PreflightDocument.java:168)
>>       at ch.eugster.pdfa.validation.PdfaValidator.validateFile(PdfaValidator.java:198)
>>       at ch.eugster.pdfa.validation.PdfaValidator.validate(PdfaValidator.java:105)
>>       at ch.eugster.pdfa.validation.PdfaValidator.validate(PdfaValidator.java:97)
>>       at ch.eugster.pdfa.validation.PdfaValidator.<init>(PdfaValidator.java:77)
>>       at
>> ch.eugster.pdfa.validation.PdfaValidator.main(PdfaValidator.java:39)
>> 
>> Christian
>> 
>> -----Ursprüngliche Nachricht-----
>> Von: Maruan Sahyoun [mailto:sahyoun@fileaffairs.de]
>> Gesendet: Freitag, 30. Januar 2015 10:55
>> An: users@pdfbox.apache.org
>> Betreff: Re: NullPointerException while validating PDF/A files
>> 
>> Dear Christian,
>> 
>> which version of PDFBox are you using? Could you provide a full stack trace?
>> 
>> BR
>> 
>> Maruan Sahyoun
>> 
>> FileAffairs GmbH
>> Josef-Schappe-Straße 21
>> 40882 Ratingen
>> 
>> Tel: +49 (2102) 89497 88
>> Fax: +49 (2102) 89497 91
>> sahyoun@fileaffairs.de
>> www.fileaffairs.de
>> 
>> Geschäftsführer: Maruan Sahyoun
>> Handelsregister: AG Düsseldorf, HRB 53837
>> UST.-ID: DE248275827
>> 
>> Am 30.01.2015 um 10:45 schrieb Eugster Christian BB_SK <ch...@stadt.sg.ch>:
>> 
>>> Hi ,
>>> previously I searched in the web for this issue but did not find anything about it.
>>> I am using pdfbox to validate pdf/a files. There are 265 files to validate, most of them passed without problems. On 7 files however validating throws a nullpointerexception. The place where this exception is thrown within pdfbox is  org.apache.pdfbox.util.PDFStreamEngine. processSubStream(PDPage aPage, PDResources resources, COSStream cosStream) throws IOException within the finally clause where streamResourcesStack.pop().clear() is done. Because I have no chance to go further due to extremely restricted authorizations I can not say more about it. The files in question are generated by Microsoft Office 2010 without protection. The content of the files has informations about persons and I am not allowed to distribute them.
>>> 
>>> Does anybody know about this and what could be the problem? What am I to do to avoid this problem? Do you need any further information? Thanks for any response!
>>> 
>>> Freundliche Grüsse
>>> Christian Eugster
>>> 
>>> Stadtkanzlei l Stadt St.Gallen l Rathaus l 9001 St.Gallen Tel +41 71
>>> 224 XX XX l
>>> christian.eugster@stadt.sg.ch<ma...@stadt.sg.ch> l
>>> www.stadt.sg.ch<http://www.stadt.sg.ch/>
>>> Erreichbarkeit: jeweils Do und Fr der zweiten Monatshälfte.
>>> 
>>> 
>>> ________________________________
>>> 
>>> Hinweis: Diese Mitteilung ist ausschliesslich für die als Adressaten bezeichneten Personen bestimmt. Sie kann vertrauliche und rechtlich geschützte Informationen enthalten. Sollten Sie diese Mitteilung irrtümlich erhalten haben, bitten wir Sie, uns unverzüglich zu benachrichtigen und diese Mitteilung zu löschen. Das unerlaubte Kopieren sowie die unbefugte Weitergabe dieses E-Mails ist nicht gestattet. Besten Dank.
>> 
>> 
>> ________________________________
>> 
>> Hinweis: Diese Mitteilung ist ausschliesslich für die als Adressaten bezeichneten Personen bestimmt. Sie kann vertrauliche und rechtlich geschützte Informationen enthalten. Sollten Sie diese Mitteilung irrtümlich erhalten haben, bitten wir Sie, uns unverzüglich zu benachrichtigen und diese Mitteilung zu löschen. Das unerlaubte Kopieren sowie die unbefugte Weitergabe dieses E-Mails ist nicht gestattet. Besten Dank.
>> 
>> ---------------------------------------------------------------------
>> To unsubscribe, e-mail: users-unsubscribe@pdfbox.apache.org
>> For additional commands, e-mail: users-help@pdfbox.apache.org
>> 
> 
> 
> ________________________________
> 
> Hinweis: Diese Mitteilung ist ausschliesslich für die als Adressaten bezeichneten Personen bestimmt. Sie kann vertrauliche und rechtlich geschützte Informationen enthalten. Sollten Sie diese Mitteilung irrtümlich erhalten haben, bitten wir Sie, uns unverzüglich zu benachrichtigen und diese Mitteilung zu löschen. Das unerlaubte Kopieren sowie die unbefugte Weitergabe dieses E-Mails ist nicht gestattet. Besten Dank.
> 
> ---------------------------------------------------------------------
> To unsubscribe, e-mail: users-unsubscribe@pdfbox.apache.org
> For additional commands, e-mail: users-help@pdfbox.apache.org
> 


AW: NullPointerException while validating PDF/A files

Posted by Eugster Christian BB_SK <ch...@stadt.sg.ch>.
Hi Maruan,

I shall try it with the versions you proposed. It will take some time, because I shall work in the second half of February, but I shall inform you about the results. Thank you very much!

Christian

-----Ursprüngliche Nachricht-----
Von: Maruan Sahyoun [mailto:sahyoun@fileaffairs.de]
Gesendet: Freitag, 30. Januar 2015 11:24
An: users@pdfbox.apache.org
Betreff: Re: NullPointerException while validating PDF/A files

Hi Christian,

would it be an option to test with the 1.8.9 and 2.0.0 Snapshot builds [https://repository.apache.org/content/groups/snapshots/org/apache/pdfbox/preflight-app/] to see if the issue has been resolved lately (there were some enhancements to parsing, preflight and especially with 2.0 for font handling)?

If that issue hasn't been addressed we would need a sample file to reproduce the issue. If the data is confidential there is the option to pass it to one of the committers privately. The other option would be to decode the pdf inspect the portion where it's failing and copy that PDF portion.

BR

Maruan


Am 30.01.2015 um 10:59 schrieb Eugster Christian BB_SK <ch...@stadt.sg.ch>:

> Dear Maruan,
>
> Wow, that was fast...
>
> Yes, it is version 1.8.8 and the stacktrace I get is:
>
> 10:58:25.668 [main] DEBUG org.apache.pdfbox.util.PDFStreamEngine -
> processing substream token: PDFOperator{TJ} java.lang.NullPointerException
>        at org.apache.pdfbox.pdmodel.font.PDType0Font.getFontWidth(PDType0Font.java:188)
>        at org.apache.pdfbox.preflight.font.container.FontContainer.checkGlyphWith(FontContainer.java:114)
>        at org.apache.pdfbox.preflight.content.ContentStreamWrapper.validText(ContentStreamWrapper.java:372)
>        at org.apache.pdfbox.preflight.content.ContentStreamWrapper.validStringArray(ContentStreamWrapper.java:296)
>        at org.apache.pdfbox.preflight.content.ContentStreamWrapper.validStringArray(ContentStreamWrapper.java:292)
>        at org.apache.pdfbox.preflight.content.ContentStreamWrapper.checkShowTextOperators(ContentStreamWrapper.java:208)
>        at org.apache.pdfbox.preflight.content.ContentStreamWrapper.processOperator(ContentStreamWrapper.java:180)
>        at org.apache.pdfbox.util.PDFStreamEngine.processSubStream(PDFStreamEngine.java:268)
>        at org.apache.pdfbox.util.PDFStreamEngine.processSubStream(PDFStreamEngine.java:235)
>        at org.apache.pdfbox.util.PDFStreamEngine.processStream(PDFStreamEngine.java:215)
>        at org.apache.pdfbox.preflight.content.ContentStreamWrapper.validPageContentStream(ContentStreamWrapper.java:75)
>        at org.apache.pdfbox.preflight.process.reflect.SinglePageValidationProcess.validateContent(SinglePageValidationProcess.java:179)
>        at org.apache.pdfbox.preflight.process.reflect.SinglePageValidationProcess.validate(SinglePageValidationProcess.java:87)
>        at org.apache.pdfbox.preflight.utils.ContextHelper.callValidation(ContextHelper.java:81)
>        at org.apache.pdfbox.preflight.utils.ContextHelper.validateElement(ContextHelper.java:54)
>        at org.apache.pdfbox.preflight.process.PageTreeValidationProcess.validatePage(PageTreeValidationProcess.java:58)
>        at org.apache.pdfbox.preflight.process.PageTreeValidationProcess.validate(PageTreeValidationProcess.java:47)
>        at org.apache.pdfbox.preflight.utils.ContextHelper.callValidation(ContextHelper.java:81)
>        at org.apache.pdfbox.preflight.utils.ContextHelper.validateElement(ContextHelper.java:96)
>        at org.apache.pdfbox.preflight.PreflightDocument.validate(PreflightDocument.java:168)
>        at ch.eugster.pdfa.validation.PdfaValidator.validateFile(PdfaValidator.java:198)
>        at ch.eugster.pdfa.validation.PdfaValidator.validate(PdfaValidator.java:105)
>        at ch.eugster.pdfa.validation.PdfaValidator.validate(PdfaValidator.java:97)
>        at ch.eugster.pdfa.validation.PdfaValidator.<init>(PdfaValidator.java:77)
>        at
> ch.eugster.pdfa.validation.PdfaValidator.main(PdfaValidator.java:39)
>
> Christian
>
> -----Ursprüngliche Nachricht-----
> Von: Maruan Sahyoun [mailto:sahyoun@fileaffairs.de]
> Gesendet: Freitag, 30. Januar 2015 10:55
> An: users@pdfbox.apache.org
> Betreff: Re: NullPointerException while validating PDF/A files
>
> Dear Christian,
>
> which version of PDFBox are you using? Could you provide a full stack trace?
>
> BR
>
> Maruan Sahyoun
>
> FileAffairs GmbH
> Josef-Schappe-Straße 21
> 40882 Ratingen
>
> Tel: +49 (2102) 89497 88
> Fax: +49 (2102) 89497 91
> sahyoun@fileaffairs.de
> www.fileaffairs.de
>
> Geschäftsführer: Maruan Sahyoun
> Handelsregister: AG Düsseldorf, HRB 53837
> UST.-ID: DE248275827
>
> Am 30.01.2015 um 10:45 schrieb Eugster Christian BB_SK <ch...@stadt.sg.ch>:
>
>> Hi ,
>> previously I searched in the web for this issue but did not find anything about it.
>> I am using pdfbox to validate pdf/a files. There are 265 files to validate, most of them passed without problems. On 7 files however validating throws a nullpointerexception. The place where this exception is thrown within pdfbox is  org.apache.pdfbox.util.PDFStreamEngine. processSubStream(PDPage aPage, PDResources resources, COSStream cosStream) throws IOException within the finally clause where streamResourcesStack.pop().clear() is done. Because I have no chance to go further due to extremely restricted authorizations I can not say more about it. The files in question are generated by Microsoft Office 2010 without protection. The content of the files has informations about persons and I am not allowed to distribute them.
>>
>> Does anybody know about this and what could be the problem? What am I to do to avoid this problem? Do you need any further information? Thanks for any response!
>>
>> Freundliche Grüsse
>> Christian Eugster
>>
>> Stadtkanzlei l Stadt St.Gallen l Rathaus l 9001 St.Gallen Tel +41 71
>> 224 XX XX l
>> christian.eugster@stadt.sg.ch<ma...@stadt.sg.ch> l
>> www.stadt.sg.ch<http://www.stadt.sg.ch/>
>> Erreichbarkeit: jeweils Do und Fr der zweiten Monatshälfte.
>>
>>
>> ________________________________
>>
>> Hinweis: Diese Mitteilung ist ausschliesslich für die als Adressaten bezeichneten Personen bestimmt. Sie kann vertrauliche und rechtlich geschützte Informationen enthalten. Sollten Sie diese Mitteilung irrtümlich erhalten haben, bitten wir Sie, uns unverzüglich zu benachrichtigen und diese Mitteilung zu löschen. Das unerlaubte Kopieren sowie die unbefugte Weitergabe dieses E-Mails ist nicht gestattet. Besten Dank.
>
>
> ________________________________
>
> Hinweis: Diese Mitteilung ist ausschliesslich für die als Adressaten bezeichneten Personen bestimmt. Sie kann vertrauliche und rechtlich geschützte Informationen enthalten. Sollten Sie diese Mitteilung irrtümlich erhalten haben, bitten wir Sie, uns unverzüglich zu benachrichtigen und diese Mitteilung zu löschen. Das unerlaubte Kopieren sowie die unbefugte Weitergabe dieses E-Mails ist nicht gestattet. Besten Dank.
>
> ---------------------------------------------------------------------
> To unsubscribe, e-mail: users-unsubscribe@pdfbox.apache.org
> For additional commands, e-mail: users-help@pdfbox.apache.org
>


________________________________

Hinweis: Diese Mitteilung ist ausschliesslich für die als Adressaten bezeichneten Personen bestimmt. Sie kann vertrauliche und rechtlich geschützte Informationen enthalten. Sollten Sie diese Mitteilung irrtümlich erhalten haben, bitten wir Sie, uns unverzüglich zu benachrichtigen und diese Mitteilung zu löschen. Das unerlaubte Kopieren sowie die unbefugte Weitergabe dieses E-Mails ist nicht gestattet. Besten Dank.

---------------------------------------------------------------------
To unsubscribe, e-mail: users-unsubscribe@pdfbox.apache.org
For additional commands, e-mail: users-help@pdfbox.apache.org


Re: NullPointerException while validating PDF/A files

Posted by Maruan Sahyoun <sa...@fileaffairs.de>.
Hi Christian,

would it be an option to test with the 1.8.9 and 2.0.0 Snapshot builds [https://repository.apache.org/content/groups/snapshots/org/apache/pdfbox/preflight-app/] to see if the issue has been resolved lately (there were some enhancements to parsing, preflight and especially with 2.0 for font handling)?

If that issue hasn't been addressed we would need a sample file to reproduce the issue. If the data is confidential there is the option to pass it to one of the committers privately. The other option would be to decode the pdf inspect the portion where it's failing and copy that PDF portion.

BR

Maruan


Am 30.01.2015 um 10:59 schrieb Eugster Christian BB_SK <ch...@stadt.sg.ch>:

> Dear Maruan,
> 
> Wow, that was fast...
> 
> Yes, it is version 1.8.8 and the stacktrace I get is:
> 
> 10:58:25.668 [main] DEBUG org.apache.pdfbox.util.PDFStreamEngine - processing substream token: PDFOperator{TJ}
> java.lang.NullPointerException
>        at org.apache.pdfbox.pdmodel.font.PDType0Font.getFontWidth(PDType0Font.java:188)
>        at org.apache.pdfbox.preflight.font.container.FontContainer.checkGlyphWith(FontContainer.java:114)
>        at org.apache.pdfbox.preflight.content.ContentStreamWrapper.validText(ContentStreamWrapper.java:372)
>        at org.apache.pdfbox.preflight.content.ContentStreamWrapper.validStringArray(ContentStreamWrapper.java:296)
>        at org.apache.pdfbox.preflight.content.ContentStreamWrapper.validStringArray(ContentStreamWrapper.java:292)
>        at org.apache.pdfbox.preflight.content.ContentStreamWrapper.checkShowTextOperators(ContentStreamWrapper.java:208)
>        at org.apache.pdfbox.preflight.content.ContentStreamWrapper.processOperator(ContentStreamWrapper.java:180)
>        at org.apache.pdfbox.util.PDFStreamEngine.processSubStream(PDFStreamEngine.java:268)
>        at org.apache.pdfbox.util.PDFStreamEngine.processSubStream(PDFStreamEngine.java:235)
>        at org.apache.pdfbox.util.PDFStreamEngine.processStream(PDFStreamEngine.java:215)
>        at org.apache.pdfbox.preflight.content.ContentStreamWrapper.validPageContentStream(ContentStreamWrapper.java:75)
>        at org.apache.pdfbox.preflight.process.reflect.SinglePageValidationProcess.validateContent(SinglePageValidationProcess.java:179)
>        at org.apache.pdfbox.preflight.process.reflect.SinglePageValidationProcess.validate(SinglePageValidationProcess.java:87)
>        at org.apache.pdfbox.preflight.utils.ContextHelper.callValidation(ContextHelper.java:81)
>        at org.apache.pdfbox.preflight.utils.ContextHelper.validateElement(ContextHelper.java:54)
>        at org.apache.pdfbox.preflight.process.PageTreeValidationProcess.validatePage(PageTreeValidationProcess.java:58)
>        at org.apache.pdfbox.preflight.process.PageTreeValidationProcess.validate(PageTreeValidationProcess.java:47)
>        at org.apache.pdfbox.preflight.utils.ContextHelper.callValidation(ContextHelper.java:81)
>        at org.apache.pdfbox.preflight.utils.ContextHelper.validateElement(ContextHelper.java:96)
>        at org.apache.pdfbox.preflight.PreflightDocument.validate(PreflightDocument.java:168)
>        at ch.eugster.pdfa.validation.PdfaValidator.validateFile(PdfaValidator.java:198)
>        at ch.eugster.pdfa.validation.PdfaValidator.validate(PdfaValidator.java:105)
>        at ch.eugster.pdfa.validation.PdfaValidator.validate(PdfaValidator.java:97)
>        at ch.eugster.pdfa.validation.PdfaValidator.<init>(PdfaValidator.java:77)
>        at ch.eugster.pdfa.validation.PdfaValidator.main(PdfaValidator.java:39)
> 
> Christian
> 
> -----Ursprüngliche Nachricht-----
> Von: Maruan Sahyoun [mailto:sahyoun@fileaffairs.de]
> Gesendet: Freitag, 30. Januar 2015 10:55
> An: users@pdfbox.apache.org
> Betreff: Re: NullPointerException while validating PDF/A files
> 
> Dear Christian,
> 
> which version of PDFBox are you using? Could you provide a full stack trace?
> 
> BR
> 
> Maruan Sahyoun
> 
> FileAffairs GmbH
> Josef-Schappe-Straße 21
> 40882 Ratingen
> 
> Tel: +49 (2102) 89497 88
> Fax: +49 (2102) 89497 91
> sahyoun@fileaffairs.de
> www.fileaffairs.de
> 
> Geschäftsführer: Maruan Sahyoun
> Handelsregister: AG Düsseldorf, HRB 53837
> UST.-ID: DE248275827
> 
> Am 30.01.2015 um 10:45 schrieb Eugster Christian BB_SK <ch...@stadt.sg.ch>:
> 
>> Hi ,
>> previously I searched in the web for this issue but did not find anything about it.
>> I am using pdfbox to validate pdf/a files. There are 265 files to validate, most of them passed without problems. On 7 files however validating throws a nullpointerexception. The place where this exception is thrown within pdfbox is  org.apache.pdfbox.util.PDFStreamEngine. processSubStream(PDPage aPage, PDResources resources, COSStream cosStream) throws IOException within the finally clause where streamResourcesStack.pop().clear() is done. Because I have no chance to go further due to extremely restricted authorizations I can not say more about it. The files in question are generated by Microsoft Office 2010 without protection. The content of the files has informations about persons and I am not allowed to distribute them.
>> 
>> Does anybody know about this and what could be the problem? What am I to do to avoid this problem? Do you need any further information? Thanks for any response!
>> 
>> Freundliche Grüsse
>> Christian Eugster
>> 
>> Stadtkanzlei l Stadt St.Gallen l Rathaus l 9001 St.Gallen Tel +41 71
>> 224 XX XX l
>> christian.eugster@stadt.sg.ch<ma...@stadt.sg.ch> l
>> www.stadt.sg.ch<http://www.stadt.sg.ch/>
>> Erreichbarkeit: jeweils Do und Fr der zweiten Monatshälfte.
>> 
>> 
>> ________________________________
>> 
>> Hinweis: Diese Mitteilung ist ausschliesslich für die als Adressaten bezeichneten Personen bestimmt. Sie kann vertrauliche und rechtlich geschützte Informationen enthalten. Sollten Sie diese Mitteilung irrtümlich erhalten haben, bitten wir Sie, uns unverzüglich zu benachrichtigen und diese Mitteilung zu löschen. Das unerlaubte Kopieren sowie die unbefugte Weitergabe dieses E-Mails ist nicht gestattet. Besten Dank.
> 
> 
> ________________________________
> 
> Hinweis: Diese Mitteilung ist ausschliesslich für die als Adressaten bezeichneten Personen bestimmt. Sie kann vertrauliche und rechtlich geschützte Informationen enthalten. Sollten Sie diese Mitteilung irrtümlich erhalten haben, bitten wir Sie, uns unverzüglich zu benachrichtigen und diese Mitteilung zu löschen. Das unerlaubte Kopieren sowie die unbefugte Weitergabe dieses E-Mails ist nicht gestattet. Besten Dank.
> 
> ---------------------------------------------------------------------
> To unsubscribe, e-mail: users-unsubscribe@pdfbox.apache.org
> For additional commands, e-mail: users-help@pdfbox.apache.org
> 


AW: NullPointerException while validating PDF/A files

Posted by Eugster Christian BB_SK <ch...@stadt.sg.ch>.
Dear Maruan,

Wow, that was fast...

Yes, it is version 1.8.8 and the stacktrace I get is:

10:58:25.668 [main] DEBUG org.apache.pdfbox.util.PDFStreamEngine - processing substream token: PDFOperator{TJ}
java.lang.NullPointerException
        at org.apache.pdfbox.pdmodel.font.PDType0Font.getFontWidth(PDType0Font.java:188)
        at org.apache.pdfbox.preflight.font.container.FontContainer.checkGlyphWith(FontContainer.java:114)
        at org.apache.pdfbox.preflight.content.ContentStreamWrapper.validText(ContentStreamWrapper.java:372)
        at org.apache.pdfbox.preflight.content.ContentStreamWrapper.validStringArray(ContentStreamWrapper.java:296)
        at org.apache.pdfbox.preflight.content.ContentStreamWrapper.validStringArray(ContentStreamWrapper.java:292)
        at org.apache.pdfbox.preflight.content.ContentStreamWrapper.checkShowTextOperators(ContentStreamWrapper.java:208)
        at org.apache.pdfbox.preflight.content.ContentStreamWrapper.processOperator(ContentStreamWrapper.java:180)
        at org.apache.pdfbox.util.PDFStreamEngine.processSubStream(PDFStreamEngine.java:268)
        at org.apache.pdfbox.util.PDFStreamEngine.processSubStream(PDFStreamEngine.java:235)
        at org.apache.pdfbox.util.PDFStreamEngine.processStream(PDFStreamEngine.java:215)
        at org.apache.pdfbox.preflight.content.ContentStreamWrapper.validPageContentStream(ContentStreamWrapper.java:75)
        at org.apache.pdfbox.preflight.process.reflect.SinglePageValidationProcess.validateContent(SinglePageValidationProcess.java:179)
        at org.apache.pdfbox.preflight.process.reflect.SinglePageValidationProcess.validate(SinglePageValidationProcess.java:87)
        at org.apache.pdfbox.preflight.utils.ContextHelper.callValidation(ContextHelper.java:81)
        at org.apache.pdfbox.preflight.utils.ContextHelper.validateElement(ContextHelper.java:54)
        at org.apache.pdfbox.preflight.process.PageTreeValidationProcess.validatePage(PageTreeValidationProcess.java:58)
        at org.apache.pdfbox.preflight.process.PageTreeValidationProcess.validate(PageTreeValidationProcess.java:47)
        at org.apache.pdfbox.preflight.utils.ContextHelper.callValidation(ContextHelper.java:81)
        at org.apache.pdfbox.preflight.utils.ContextHelper.validateElement(ContextHelper.java:96)
        at org.apache.pdfbox.preflight.PreflightDocument.validate(PreflightDocument.java:168)
        at ch.eugster.pdfa.validation.PdfaValidator.validateFile(PdfaValidator.java:198)
        at ch.eugster.pdfa.validation.PdfaValidator.validate(PdfaValidator.java:105)
        at ch.eugster.pdfa.validation.PdfaValidator.validate(PdfaValidator.java:97)
        at ch.eugster.pdfa.validation.PdfaValidator.<init>(PdfaValidator.java:77)
        at ch.eugster.pdfa.validation.PdfaValidator.main(PdfaValidator.java:39)

Christian

-----Ursprüngliche Nachricht-----
Von: Maruan Sahyoun [mailto:sahyoun@fileaffairs.de]
Gesendet: Freitag, 30. Januar 2015 10:55
An: users@pdfbox.apache.org
Betreff: Re: NullPointerException while validating PDF/A files

Dear Christian,

which version of PDFBox are you using? Could you provide a full stack trace?

BR

Maruan Sahyoun

FileAffairs GmbH
Josef-Schappe-Straße 21
40882 Ratingen

Tel: +49 (2102) 89497 88
Fax: +49 (2102) 89497 91
sahyoun@fileaffairs.de
www.fileaffairs.de

Geschäftsführer: Maruan Sahyoun
Handelsregister: AG Düsseldorf, HRB 53837
UST.-ID: DE248275827

Am 30.01.2015 um 10:45 schrieb Eugster Christian BB_SK <ch...@stadt.sg.ch>:

> Hi ,
> previously I searched in the web for this issue but did not find anything about it.
> I am using pdfbox to validate pdf/a files. There are 265 files to validate, most of them passed without problems. On 7 files however validating throws a nullpointerexception. The place where this exception is thrown within pdfbox is  org.apache.pdfbox.util.PDFStreamEngine. processSubStream(PDPage aPage, PDResources resources, COSStream cosStream) throws IOException within the finally clause where streamResourcesStack.pop().clear() is done. Because I have no chance to go further due to extremely restricted authorizations I can not say more about it. The files in question are generated by Microsoft Office 2010 without protection. The content of the files has informations about persons and I am not allowed to distribute them.
>
> Does anybody know about this and what could be the problem? What am I to do to avoid this problem? Do you need any further information? Thanks for any response!
>
> Freundliche Grüsse
> Christian Eugster
>
> Stadtkanzlei l Stadt St.Gallen l Rathaus l 9001 St.Gallen Tel +41 71
> 224 XX XX l
> christian.eugster@stadt.sg.ch<ma...@stadt.sg.ch> l
> www.stadt.sg.ch<http://www.stadt.sg.ch/>
> Erreichbarkeit: jeweils Do und Fr der zweiten Monatshälfte.
>
>
> ________________________________
>
> Hinweis: Diese Mitteilung ist ausschliesslich für die als Adressaten bezeichneten Personen bestimmt. Sie kann vertrauliche und rechtlich geschützte Informationen enthalten. Sollten Sie diese Mitteilung irrtümlich erhalten haben, bitten wir Sie, uns unverzüglich zu benachrichtigen und diese Mitteilung zu löschen. Das unerlaubte Kopieren sowie die unbefugte Weitergabe dieses E-Mails ist nicht gestattet. Besten Dank.


________________________________

Hinweis: Diese Mitteilung ist ausschliesslich für die als Adressaten bezeichneten Personen bestimmt. Sie kann vertrauliche und rechtlich geschützte Informationen enthalten. Sollten Sie diese Mitteilung irrtümlich erhalten haben, bitten wir Sie, uns unverzüglich zu benachrichtigen und diese Mitteilung zu löschen. Das unerlaubte Kopieren sowie die unbefugte Weitergabe dieses E-Mails ist nicht gestattet. Besten Dank.

---------------------------------------------------------------------
To unsubscribe, e-mail: users-unsubscribe@pdfbox.apache.org
For additional commands, e-mail: users-help@pdfbox.apache.org


Re: NullPointerException while validating PDF/A files

Posted by Maruan Sahyoun <sa...@fileaffairs.de>.
Dear Christian,

which version of PDFBox are you using? Could you provide a full stack trace?

BR

Maruan Sahyoun

FileAffairs GmbH
Josef-Schappe-Straße 21
40882 Ratingen

Tel: +49 (2102) 89497 88
Fax: +49 (2102) 89497 91
sahyoun@fileaffairs.de
www.fileaffairs.de

Geschäftsführer: Maruan Sahyoun
Handelsregister: AG Düsseldorf, HRB 53837
UST.-ID: DE248275827

Am 30.01.2015 um 10:45 schrieb Eugster Christian BB_SK <ch...@stadt.sg.ch>:

> Hi ,
> previously I searched in the web for this issue but did not find anything about it.
> I am using pdfbox to validate pdf/a files. There are 265 files to validate, most of them passed without problems. On 7 files however validating throws a nullpointerexception. The place where this exception is thrown within pdfbox is  org.apache.pdfbox.util.PDFStreamEngine. processSubStream(PDPage aPage, PDResources resources, COSStream cosStream) throws IOException within the finally clause where streamResourcesStack.pop().clear() is done. Because I have no chance to go further due to extremely restricted authorizations I can not say more about it. The files in question are generated by Microsoft Office 2010 without protection. The content of the files has informations about persons and I am not allowed to distribute them.
> 
> Does anybody know about this and what could be the problem? What am I to do to avoid this problem? Do you need any further information? Thanks for any response!
> 
> Freundliche Grüsse
> Christian Eugster
> 
> Stadtkanzlei l Stadt St.Gallen l Rathaus l 9001 St.Gallen
> Tel +41 71 224 XX XX l christian.eugster@stadt.sg.ch<ma...@stadt.sg.ch> l www.stadt.sg.ch<http://www.stadt.sg.ch/>
> Erreichbarkeit: jeweils Do und Fr der zweiten Monatshälfte.
> 
> 
> ________________________________
> 
> Hinweis: Diese Mitteilung ist ausschliesslich für die als Adressaten bezeichneten Personen bestimmt. Sie kann vertrauliche und rechtlich geschützte Informationen enthalten. Sollten Sie diese Mitteilung irrtümlich erhalten haben, bitten wir Sie, uns unverzüglich zu benachrichtigen und diese Mitteilung zu löschen. Das unerlaubte Kopieren sowie die unbefugte Weitergabe dieses E-Mails ist nicht gestattet. Besten Dank.