分類
其它

中文OCR與繁簡轉換

以看到的這條豆瓣廣播為例。保存圖片後打開Online OCR(遊客每小時可轉換15個文件),上傳圖片即可轉換為文本。對於標準字型的文本識別率還是蠻高的,但是換行時會有多餘的空格。人工刪除空個後打開這個繁體簡體轉換/編碼轉換,粘貼文本到輸入框,點擊轉換為繁體按鈕,即可轉換實現繁簡轉換。

在 Fedora39 上可以安裝 gImageReader 來執行 tesseract-ocr。PDF 文件也可以直接打開。用鼠標選取要識別的區域,右鍵選識別就可以了。

sudo dnf install gimagereader-gtk
#安裝簡體中文、繁體中文、繁體中文直排支持
sudo dnf install tesseract-langpack-chi_sim tesseract-langpack-chi_tra tesseract-langpack-chi_tra_vert tesseract-script-hans tesseract-script-hant tesseract-script-hant_vert

本文更新於 2024/04/18。

分類
說說

19030708

小康就是雨天不必打破傘,晴天不去騎破車。

分類
說說

天氣

以前,我對所有的天氣都一視同仁,只有當某個天氣持續了很多天,才感到有些厭倦。現在,我住在大都市裡,越來越喜歡下雨。我所在的城市不停的建設,應該有30年了吧,無論你去那裡,永遠都能看到工地,聽到工地高中低頻的轟鳴。唯一安靜的時候就是下雨的時候,可以得到片刻安寧以至一晚好覺。

分類
软件

衛星圖

衛星圖可以帶來比繪製地圖更真實的體驗。網頁版谷歌地圖提供的衛星圖已經很方便,專業版還可以看過往的衛星圖,在時間跨度上看地貌是非常震撼的,比如深圳的南山半島(建造)和岩手的鵜住居(破壞)。

Google地球專業版可以直接從官方網站下載。為Linux用戶提供64位元的適用於 Debian/Ubuntu的deb包,和適用於 Fedora/openSUSE的rpm包。安裝後應該會出現在程序菜單網絡子菜單下。

#通過代理打開Google地球專業版
proxychains4 google-earth-pro
##如果有更新可能會報未導入Google公鑰的錯誤,通過下面命令導入即可
sudo rpm --import https://dl.google.com/linux/linux_signing_key.pub
#導入公鑰後可再嘗試
sudo dnf update google-earth-pro-stable

除了谷歌地圖,OpenStreetMap的編輯器亦提供Bing 空照圖、DigitalGlobe Premium 空照圖、DigitalGlobe Standard 空照圖、Esri 世界衛星圖、Esri 世界衛星圖(清晰版)Beta、Mapbox 衛星圖這六種衛星圖,根據地區不同,有的非常清晰有的則很模糊。

分類
記事

181027沙螺灣

有一年夏天帶岳父去爬香港大嶼山,下山下到一半時大概四點半左右吧,遇到一輛巡邏警車,對方非常熱情把我們送到了山下,因為警官擔心等下天黑萬一我們下不去山會有危險。這是我第一次也是唯一一次坐香港警車,乾淨舒適,還不錯,港普口音也很有意思。

最近看到一則新聞,大概是一位滑翔傘愛好者不幸在大嶼山遇難。逝者隨身攜帶的手機有谷歌位置記錄,但是警方未能善用以致延誤救援時機最終釀成悲劇。其中比較吃驚的是,逝者的妻子將手機最後獲取到的10米左右精度的GPS記錄交給警察,警察居然說不知道怎麼打開json格式文件。

港珠澳大橋通車,又一座時代的雕像落成。

於是在這個周六我們又去了一次大澳。06:50到達公交站,過關坐上了07:25準時發車的B3巴士,在屯門碼頭轉富裕小輪就到了沙螺灣。東涌碼頭的硬朗阿伯,從我們第一次去東涌就在那裡工作,有一隻可愛且有個性的肥貓。可惜這次不在東涌下船,不能去聊幾句,只在短暫而嘈雜的靠岸時間透過船艙的窗戶遠遠地望到他喊「東涌東涌,東涌東涌……」。

巨大事物愛好者一定要來沙螺灣看看,倒不是沙螺灣有什麼巨大建築,而是因為沙螺灣比鄰香港機場的起飛跑道。在不遠的小山坡上可以清晰的感受到飛機起飛時的震撼,噪音和污染。香港機場為香港人和比鄰香港的內地人提供了非常好的服務,我在這裡說它污染好像很沒有良心。但是無論我說不說,飛機畢竟是一個較大的污染源,再說我也沒有呼籲大家為了環保都不要坐飛機了。提及飛機污染主要是想傳達,我們作為地球的一份子,還是應該多多保護環境,人與自然應該和諧相處。我每提一次飛機污染,便能提醒我每次旅行都產生了巨大的碳排放,便能督促我再日後的生活中,在力所能及的地方為環保出一分力,比如儘可能減少塑料的使用,不買瓶裝水和瓶裝飲料,儘量購買本地食材,不可浪費等。從沙螺灣到大澳有很大一段都走在東澳古道上,這條路屬於老少咸宜的路線,路況優良,風景優美(大橋扣一分,沿途散落的共享單車再扣一分),途中還有食肆可以休息。運氣好的話還能遇到本地人擺在門口的蔬果,本地香蕉或洛神花,10元一架或一小筐,要的話就自己放10塊錢在那裡,拿上自己要買的東西。其實10塊錢,在香港吃個早餐都不夠,所以這種小攤應該也是也是本着不浪費的原則在惠及大眾吧。在其他國家也有遇到過這種無人小攤,換算成當地貨幣都是1塊錢的感覺,性質也都是一樣的。忽然想起一個蘇聯笑話,大概是說撒哈拉實行了更加先進的制度後造成了沙子的短缺。

在炎熱的天氣里步行兩個小時後,一大杯凍檸樂真是無比的享受。凍檸樂其實是非常好做的,只需要冰,冰可樂和檸檬。但是如果想做的好喝,可能需要更多的冰,更好的可樂和有滋味的檸檬,或許還有商戶的責任心。那麼不及格的凍檸樂又是怎麼做的呢,那必然是凍檸樂粉啊。在神奇的淘寶世界里,「一滴香」這樣的存在非常普遍。我的舌頭不靈敏,不能準確分辨出真香還是一滴香;身體更加不靈敏,或許要在十年數十年後才能體現出毒素帶來的危害。到那時,應該也不會聯想到樓下那家好吃的僅僅開了半年的小館子。風聲雨聲讀書聲,事事關心到頭來就什麼都沒關心到,還不如多留意自己呼吸的空氣,飲用的食水,入口的飯菜和目力所及的綠化帶。

關於這天的另一個版本:沙螺灣徒步大澳

分類
Linux 软件

Linux上的離線字典——GoldenDict

GoldenDict是一款方便的字典應用,不僅支持離線字典和屏幕取詞,也支持在線辭典服務。Fedora直接從軟件倉庫安裝 goldendict 即可sudo dnf install goldendict,默認的屏幕取詞快捷鍵是Ctrl+C+C。

分享幾個字典的下載地址:https://1drv.ms/f/s!AiSujQyFSc-uab_ItF61BBKnLUs。GoldenDict中的字典順序也是下面順序。

  1. Babylon_English_Chinese_S_.BGL
  2. Babylon_Chinese_S_English.BGL
  3. Oxford_Advanced_Learner_English-Chinese_Dictionary-4th.bgl
  4. ConciseOxfordEnglishDictionary.dsl.dz
  5. Oxford English Dictionary (2nd Edition) .bgl
  6. 现代汉英词典(金山).dsl.dz

安卓也有GoldenDict可用,我用的免費版(谷歌市場:GoldenDict Free),有最大5個字典的限制,但是也夠用了。

使用 espeak 來發音

#安裝espeak
sudo dnf install espeak
#打開GoldenDict,菜單欄依次選擇
#編輯/字典/字典來源/程式/新增
#新增內容為:
#類型:音訊
#名稱:espeak
#命令列:/usr/bin/espeak -v en -s 120 %GDWORD%
#圖示:/usr/share/doc/espeak/html/images/lips.png
#最後勾選啟用框,保存並重啟GoldenDict就可以有英文發音了

##如果要聽法語發音,
##只需要把命令列中的 en 換成 fr 即可。

更多字典可以從這些地方獲得:http://download.huzheng.org/(來自:Good offline dictionaries for GoldenDict)

使用 Speech Dispatcher 來發音

來到 2023 年,Speech Dispatcher 是新的語音生成器。這裏記錄下在 Fedora 上安裝以及命令調用的方法:

#安裝
sudo dnf install speech-dispatcher speech-dispatcher-utils
#使用
spd-say hello

本文更新於 2023/08/12。

分類
软件

youtube-dl

Edit 221015: 如果遇到一些 youtube-dl 不支持的網址,可以嘗試用 yt-dlp,來下載,比如 arte.tv 的視頻。可以用傳統的 pip 安裝:pip install yt-dlp也可以直接允許可執行文件。使用方法類似 youtube-dl。

之前用過一些在線提取和轉換YouTube視頻的服務,近來發現這些提取或轉換的鏈接要求ip一致,那就無法用洋蔥網絡下載了。好在發現youtube-dl這麼個好工具,不僅能下載單集視頻還能下載視頻列表;不僅能單獨下載字幕還能把字幕合入視頻,非常強大。目前用的這幾個參數,記錄一下。

#安裝youtube-dl
sudo dnf install youtube-dl
##單個視頻下載
#查看可下載的視頻,注意audio only的視頻,沒有伴音的哦
youtube-dl https://www.youtube.com/watch?v=qU52CFGTGu0 -F
#下載編號為22的視頻
youtube-dl --proxy socks5://127.0.0.1:9150 qU52CFGTGu0 -f 22
#續傳中斷的視頻
youtube-dl --proxy socks5://127.0.0.1:9150 qU52CFGTGu0 -f 22 --continue
#列出所有字幕
youtube-dl --proxy socks5://127.0.0.1:9150 qU52CFGTGu0 --list-subs
#只下載字幕而不下載視頻
youtube-dl --all-subs --skip-download --proxy socks5://127.0.0.1:9150 https://www.youtube.com/watch?v=qU52CFGTGu0
#使用aria2搭配proxychains實現多進程下載
sudo dnf install aria2 proxychains-ng
proxychains4 youtube-dl -f mp4 --external-downloader aria2c --external-downloader-args '-c -j4 -x 4 -s 4 -k 5M' lW0ugxbtIEE
##視頻列表下載
#將視頻列表中的視頻連接輸出到文本文件
youtube-dl -j --flat-playlist "https://www.youtube.com/playlist?list=PLATwx1z00HsdanKZcTMQEc-n_Bhu_aZ76" | jq -r '.id' | sed 's_^_https://youtu.be/_' > list.log
#從文件里讀取視頻地址並下載,下載過的會保存於done.txt不會重複下載
youtube-dl -f mp4 --external-downloader aria2c --external-downloader-args '-c -j5 -x 5 -s 5 -k 10M --max-download-limit 1024k' --batch-file list.log --download-archive done.txt

#下載分辨率是 1080 的最佳畫質音視頻
yt-dlp --format "bv*[height=1080]+ba/b" qU52CFGTGu0
#舊電視或機頂盒可能不支持 VP90 視頻編碼以及 opus 音頻編碼
#或者不識別默認的 webm 視頻文件,這時可以選擇較舊的 avc1(h264) 視頻編碼和 mp4a 音頻編碼來解決
yt-dlp qU52CFGTGu0 -F
yt-dlp qU52CFGTGu0 -f 137+140

參考:youtube-dl批量下载时,跳过之前已经下载过的文件

Using yt-dlp in command line網頁存檔

本文更新於 2024/09/20。