本教學將引導您如何使用 filter_results.py
程式碼,從文字檔中篩選出符合特定條件的行,並提取其中的字元輸出到新的文字檔。
這篇文章是接續處理前一篇的結果, 請參考:
比較字型差異
https://codereview.max-everyday.com/compare_fonts/
前置作業
Max腳本檔案下載:
https://github.com/max32002/MaxFontScripts/blob/master/filter_results.py
程式碼功能:
filter_results.py
是一個 Python 程式,它可以:
- 讀取輸入文字檔。
- 篩選出包含 “整體” 且差異百分比小於等於指定閾值的行。
- 提取篩選出的行中,兩個單引號
''
之間的字元。 - 將提取出的字元輸出到新的文字檔。
使用步驟:
- 準備輸入文字檔:
- 將您要處理的文字檔儲存到電腦中。
- 確保文字檔的內容格式符合程式碼的預期(例如:每行包含 “整體” 和差異百分比)。
- 安裝 Python:
- 如果您的電腦尚未安裝 Python,請先至 Python 官網下載並安裝。
- 執行程式碼:
- 開啟命令列或終端機。
- 使用
cd
指令切換到filter_results.py
程式碼所在的目錄。 - 執行以下指令,並根據您的需求替換參數: Bash
python filter_results.py --input <輸入檔案路徑> --output <輸出檔案路徑> --threshold <百分比閾值>
<輸入檔案路徑>
:輸入文字檔的完整路徑。<輸出檔案路徑>
:您希望輸出的文字檔的完整路徑。<百分比閾值>
:用於篩選的百分比閾值(預設值為 9.00)。
- 例如: Bash
python filter_results.py --input input.txt --output output.txt --threshold 5.00
這個指令會讀取input.txt
檔案,篩選出差異百分比小於等於 5.00 的行,並將提取出的字元輸出到output.txt
檔案。
- 查看輸出結果:
- 程式碼執行完成後,您會在指定的輸出檔案路徑中找到一個新的文字檔。
- 開啟該文字檔,即可查看提取出的字元。
參數說明:
--input
:必要參數,用於指定輸入文字檔的路徑。--output
:必要參數,用於指定輸出文字檔的路徑。--threshold
:可選參數,用於指定篩選的百分比閾值。預設值為 9.00。
注意事項:
- 如果您不指定
--threshold
參數,程式碼會使用預設值 9.00。 - 程式碼會將提取出的字元逐行輸出到輸出檔案。
範例:
假設您的 input.txt
檔案內容如下:
字元 '一' 的差異百分比:整體 1.27%
字元 '丁' 的差異百分比:整體 2.63%
字元 '七' 的差異百分比:整體 4.46%
字元 '万' 的差異百分比:整體 4.35%
字元 '丈' 的差異百分比:整體 10.35%
執行以下指令:
Bash
python filter_results.py --input input.txt --output output.txt --threshold 5.00
output.txt
檔案的內容將會是:
一
丁
七
万