GNU/Linux >> Linux の 問題 >  >> Linux

pythonは、LinuxでMicrosoft Officeドキュメントをプレーンテキストに変換します

Microsoft Office ドキュメントを HTML またはその他の形式に変換するための通常のツールは mswordview でしたが、その後 vwWare に名前が変更されました.

コマンドライン ツールを探している場合は、AbiWord を使用して変換を実行することを実際に推奨しています。

AbiWord --to=txt

ライブラリを探している場合は、wvWare の概要ページから始めてください。また、MS Office ドキュメントを読み取るライブラリとツールのリストも維持しています。


私なら、コマンド ライン ソリューションを使用します (そして、Python サブプロセス モジュールを使用して Python からツールを実行します)。

msword のコンバーター (catdoc )、エクセル (xls2csv) ) および ppt (catppt ) は (ソース形式で) ここにあります:http://vitus.wagner.pp.ru/software/catdoc/.

catppt の有用性についてコメントすることはできませんが、catdoc と xls2csv はうまく機能します!

ただし、最初にディストリビューション リポジトリを検索してください。

Python API 経由で OpenOffice にアクセスできます。

これをベースとして使用してみてください:http://wiki.services.openoffice.org/wiki/Odt2txt.py


Linux
  1. Linux での chfn コマンドの例

  2. LinuxでPDFをテキストに変換する方法(GUIおよびコマンドライン)

  3. Linux 2.7 の python を 3.5 に更新

  1. LinuxにPythonをインストールする方法

  2. LinuxMint20にPythonをインストールする方法

  3. Linuxでプレーンテキストを正当化するにはどうすればよいですか?

  1. 着信メールをText/plainからText/htmlに変更しますか?

  2. MicrosoftTeamsがLinuxで利用可能になりました

  3. RockyLinux8にPython3.10をインストールする方法