篩選文字檔中的差異百分比結果並輸出特定字元

本教學將引導您如何使用 filter_results.py 程式碼,從文字檔中篩選出符合特定條件的行,並提取其中的字元輸出到新的文字檔。

這篇文章是接續處理前一篇的結果, 請參考:

比較字型差異
https://codereview.max-everyday.com/compare_fonts/


前置作業

Max腳本檔案下載:
https://github.com/max32002/MaxFontScripts/blob/master/filter_results.py

程式碼功能:

filter_results.py 是一個 Python 程式,它可以:

  • 讀取輸入文字檔。
  • 篩選出包含 “整體” 且差異百分比小於等於指定閾值的行。
  • 提取篩選出的行中,兩個單引號 '' 之間的字元。
  • 將提取出的字元輸出到新的文字檔。

使用步驟:

  1. 準備輸入文字檔:
    • 將您要處理的文字檔儲存到電腦中。
    • 確保文字檔的內容格式符合程式碼的預期(例如:每行包含 “整體” 和差異百分比)。
  2. 安裝 Python:
    • 如果您的電腦尚未安裝 Python,請先至 Python 官網下載並安裝。
  3. 執行程式碼:
    • 開啟命令列或終端機。
    • 使用 cd 指令切換到 filter_results.py 程式碼所在的目錄。
    • 執行以下指令,並根據您的需求替換參數: Bashpython filter_results.py --input <輸入檔案路徑> --output <輸出檔案路徑> --threshold <百分比閾值>
      • <輸入檔案路徑>:輸入文字檔的完整路徑。
      • <輸出檔案路徑>:您希望輸出的文字檔的完整路徑。
      • <百分比閾值>:用於篩選的百分比閾值(預設值為 9.00)。
    • 例如: Bashpython filter_results.py --input input.txt --output output.txt --threshold 5.00 這個指令會讀取 input.txt 檔案,篩選出差異百分比小於等於 5.00 的行,並將提取出的字元輸出到 output.txt 檔案。
  4. 查看輸出結果:
    • 程式碼執行完成後,您會在指定的輸出檔案路徑中找到一個新的文字檔。
    • 開啟該文字檔,即可查看提取出的字元。

參數說明:

  • --input:必要參數,用於指定輸入文字檔的路徑。
  • --output:必要參數,用於指定輸出文字檔的路徑。
  • --threshold:可選參數,用於指定篩選的百分比閾值。預設值為 9.00。

注意事項:

  • 如果您不指定 --threshold 參數,程式碼會使用預設值 9.00。
  • 程式碼會將提取出的字元逐行輸出到輸出檔案。

範例:

假設您的 input.txt 檔案內容如下:

字元 '一' 的差異百分比:整體 1.27%
字元 '丁' 的差異百分比:整體 2.63%
字元 '七' 的差異百分比:整體 4.46%
字元 '万' 的差異百分比:整體 4.35%
字元 '丈' 的差異百分比:整體 10.35%

執行以下指令:

Bash

python filter_results.py --input input.txt --output output.txt --threshold 5.00

output.txt 檔案的內容將會是:

一
丁
七
万