Beautiful Soupは、HTMLおよびXMLドキュメントを解析するためのPythonパッケージであり、python-bs4
という名前のDebianパッケージ内にあります。 。ただし、python-bs4
packageは、Python2バージョンのDebianLinuxシステムのデフォルトパッケージです。したがって、Python3をデフォルト環境として使用する場合は、Python3とそれに対応するバージョンのBS4 python3-bs4
もインストールする必要があります。 。 python3のインストールから始めましょう:
# apt-get install -y vim python3
python3パッケージが正常にインストールされたら、python3がデフォルトとして設定されていることを確認してください。
# update-alternatives --install /usr/bin/python python /usr/bin/python3.4 2 update-alternatives: using /usr/bin/python3.4 to provide /usr/bin/python (python) in auto mode
Python 3がデフォルトバージョンであることを確認します:
# python --version Python 3.4.2
残っているのは、Pythonバージョン3に一致するようにHTMLおよびXMLパッケージを解析するBeautifulSoupをインストールすることだけです。
# apt-get install python3-bs4
全部終わった。次のスクリプト例を使用して、HTMLとXMLを解析するBeautifulSoupをテストします。
#!/usr/bin/env python3 from urllib.request import urlopen from bs4 import BeautifulSoup html = urlopen("http://www.gnu.org") bsObj = BeautifulSoup(html.read()); print (bsObj.title)
上記のコードをファイルに保存します。 scrapetest.py
実行可能にします:
$ chmod +x scrapetest.py
準備ができたら、scrapetest.py
を実行します スクリプト:
$ ./scrapetest.py <title>The GNU Operating System and the Free Software Movement</title>
トラブルシューティング
Traceback (most recent call last): File "scrapetest.py", line 2, in <module> from bs4 import BeautifulSoup ImportError: No module named 'bs4'
Pythonとbs4のバージョンが一致しないか、bs4がインストールされていません。 bs4がインストールされており、Pythonのバージョンに対応していることを確認してください。