2008年9月13日星期六

Python 學習筆記 - HTML Parser - EOF in middle of construct

最近用HTMLParser的時候發生了因為EOF(EOF in middle of construct)而產生exception的問題
後來將網頁儲存後發現是因為網頁內容不符合規範所造成的
範例:
< img //這裡不是用空白而是用換行(\n '0A')
src="" />
因此將內容中的換行全部replace成空白得以解決
看來以後要避免這種鳥問題還是先做這些前處理比較好...