取得unicode命名的圖片目錄的包含文字

為什麼要學這個?

從一個包含圖片檔案的資料夾中,提取出圖片檔名對應的 Unicode 字元,並將這些字元儲存到一個文字檔案中。

使用情境

  • 您有一組圖片,這些圖片的檔名代表 Unicode 字元(例如,65.png 代表 Unicode 字元 U+0041)。
  • 您想要快速產生一個包含這些 Unicode 字元的字元集檔案,以便在其他應用程式中使用。

前置作業

Max腳本檔案下載:
https://github.com/max32002/MaxFontScripts/blob/master/get_image_chars.py


使用方法

  1. 準備圖片資料夾:
    • 將所有檔名為 Unicode 字元編號的圖片檔案,放置在同一個資料夾中。
    • 支援的圖片格式包括:.JPG, .JPEG, .PNG, .PBM, .PGM, .PPM, .BMP, .TIF, .TIFF
  2. 執行程式:
    • 在命令列或終端機中,使用以下指令執行程式:
      python your_script_name.py --input <圖片資料夾路徑> --output <輸出檔案路徑>
      • <your_script_name.py>:您的 Python 程式檔案名稱。
      • <圖片資料夾路徑>:包含圖片檔案的資料夾路徑。
      • <輸出檔案路徑>:要儲存字元集檔案的路徑和檔名(預設為 charset_<資料夾名稱>.txt)。
  3. 範例:
    • 假設您的圖片資料夾路徑為 /home/user/images,您想要將字元集儲存到 output.txt,則執行以下指令: Bashpython your_script_name.py --input /home/user/images --output output.txt
  4. 輸出結果:
    • 程式執行完成後,會在指定的輸出檔案中,產生一個包含 Unicode 字元的字元集。
    • 如果沒有指定輸出檔案名稱,將會在當前目錄產生一個 charset_<資料夾名稱>.txt
    • 在終端機中,會顯示:
      • 輸入的資料夾路徑。
      • 輸出的檔案路徑。
      • 字元集的長度。
  5. 注意事項:
    • 圖片檔名必須是純數字,且代表有效的 Unicode 字元編號(0 到 65536)。
    • 如果輸入的資料夾是空的,程式會顯示 “source folder is empty!”。
    • 程式碼內有字元過濾的機制,可以依照需求調整.

範例圖片檔名

  • 65.png(代表 Unicode 字元 U+0041)
  • 2330.jpg
  • 12345.tif

範例輸出檔案內容:

Plaintext

A
你
...

相關文章

取得字體的包含文字
https://codereview.max-everyday.com/get-font-chars/