為什麼要學這個?
從一個包含圖片檔案的資料夾中,提取出圖片檔名對應的 Unicode 字元,並將這些字元儲存到一個文字檔案中。
使用情境
- 您有一組圖片,這些圖片的檔名代表 Unicode 字元(例如,
65.png
代表 Unicode 字元 U+0041)。 - 您想要快速產生一個包含這些 Unicode 字元的字元集檔案,以便在其他應用程式中使用。
前置作業
Max腳本檔案下載:
https://github.com/max32002/MaxFontScripts/blob/master/get_image_chars.py
使用方法
- 準備圖片資料夾:
- 將所有檔名為 Unicode 字元編號的圖片檔案,放置在同一個資料夾中。
- 支援的圖片格式包括:
.JPG
,.JPEG
,.PNG
,.PBM
,.PGM
,.PPM
,.BMP
,.TIF
,.TIFF
。
- 執行程式:
- 在命令列或終端機中,使用以下指令執行程式:
python your_script_name.py --input <圖片資料夾路徑> --output <輸出檔案路徑>
<your_script_name.py>
:您的 Python 程式檔案名稱。<圖片資料夾路徑>
:包含圖片檔案的資料夾路徑。<輸出檔案路徑>
:要儲存字元集檔案的路徑和檔名(預設為charset_<資料夾名稱>.txt
)。
- 在命令列或終端機中,使用以下指令執行程式:
- 範例:
- 假設您的圖片資料夾路徑為
/home/user/images
,您想要將字元集儲存到output.txt
,則執行以下指令: Bashpython your_script_name.py --input /home/user/images --output output.txt
- 假設您的圖片資料夾路徑為
- 輸出結果:
- 程式執行完成後,會在指定的輸出檔案中,產生一個包含 Unicode 字元的字元集。
- 如果沒有指定輸出檔案名稱,將會在當前目錄產生一個
charset_<資料夾名稱>.txt
。 - 在終端機中,會顯示:
- 輸入的資料夾路徑。
- 輸出的檔案路徑。
- 字元集的長度。
- 注意事項:
- 圖片檔名必須是純數字,且代表有效的 Unicode 字元編號(0 到 65536)。
- 如果輸入的資料夾是空的,程式會顯示 “source folder is empty!”。
- 程式碼內有字元過濾的機制,可以依照需求調整.
範例圖片檔名
65.png
(代表 Unicode 字元 U+0041)2330.jpg
12345.tif
範例輸出檔案內容:
Plaintext
A
你
...
相關文章
取得字體的包含文字
https://codereview.max-everyday.com/get-font-chars/