取得unicode命名的圖片目錄的包含文字

主要是把圖片檔名批次轉成文字清單。

為什麼要學這個?

對於做字體設計或整理素材的人很有幫助。它會掃描整個資料夾。找出符合條件的圖片並提取 Unicode 代碼。最後匯集成一個 UTF-8 編碼的文字檔。

使用情境

  • 您有一組圖片,這些圖片的檔名代表 Unicode 字元(例如,65.png 代表 Unicode 字元 U+0041)。
  • 您想要快速產生一個包含這些 Unicode 字元的字元集檔案,以便在其他應用程式中使用。

前置作業

Max腳本檔案下載:
https://github.com/max32002/MaxFontScripts/blob/master/get_image_chars.py


使用方法

你需要先安裝 Python 環境。確保腳本存成 get_image_chars.py 檔案。在終端機輸入指令就能執行。基本的語法結構很簡單。

python3 get_image_chars.py [輸入目錄] [參數]

[輸入目錄] 是必填的輸入目錄路徑。

[參數] 說明如下。

  • –output-o 用來指定輸出的文字檔檔名。預設會自動用資料夾名稱 + “.txt” 命名。
  • –filename_rule-f 決定怎麼解析檔名。有三種選項。
    • unicode_int 代表檔名是十進位數字。這是預設值
    • unicode_hex 代表檔名是十六進位數字。
    • char 代表直接讀取檔名的第一個字元。

使用範例

如果圖片檔名是 20320.png 這種十進位格式。直接輸入目錄路徑即可。

python get_image_chars.py ./my_images

如果檔名是十六進位。例如 4f60.png 這種格式。需要加上 -f 參數。

python get_image_chars.py ./my_images -f unicode_hex

如果直接用文字當檔名。例如 你.png 或 好.png。請使用 char 模式。並可以自訂輸出檔名。

python get_image_chars.py ./my_images -f char -o my_chars.txt

執行完畢後。畫面會顯示處理了多少個字。輸出的文字檔會放在你指定的路徑。

支援的圖片格式包括:.JPG, .JPEG, .PNG, .PBM, .PGM, .PPM, .BMP, .TIF, .TIFF。


相關文章

取得字體的包含文字
https://codereview.max-everyday.com/get-font-chars/