データサイエンス入門者向けに参考になるサイトをまとめてみた(文字・音声編)【week11】
マルチメディアの勉強で参考になったサイトをまとめてみました。
(今回はテキスト処理や音声処理に関連する内容です)
データサイエンスに興味あるって人は是非覗いてみてください!
■概要や全体像を掴む
5分程度の動画です。初めての人が概要をサクッと理解するのに良いです。
ITの基礎知識についてまとめられた東大のサイト。網羅性がすごいんです。2進数の説明からあります。18.6章では画像,音声や動画についてまとめられてます。
■文字コード
文字コードについてわかりやすいイメージ図があるのでややこしい「符号化文字集合と文字符号化方式の関係」もすっきりします。
とほほのWWW入門では体系的にまとめられていました。
下の記事ではJIS/Shiftjis/EUC/Unicodeについてサクッと書かれています。
■Perl入門
テキスト処理にはよくPerlという言語が使われます。
触ってみたいけど環境構築がめんどくさいって人はPerlBanjoというサイトがおすすめ。デフォルトで短いコードが入ってますが、消してから以下のprint文を入れて実行ボタン(Save...run)を押してみてください。
print("hello world");
入門サイトはいろいろありますがとほほの解説も充実してると思います。
みんな大好きドットインストールでも無料でできるみたいです。(2021/1)
https://dotinstall.com/lessons/basic_per
■音声学
東大の方のスライドです。音声学の基本的なところから波形の話まで詳しく載ってます。
■音声認識
音声認識の歴史について別の動画を挟みつつ紹介されています。
専門用語をできるだけ使わないように説明されているサイト。見習いたいです。
■PythonでSin波の合成
実際に数式でつくった波形を音声ファイルに出力して聞いてみることができます。
音波の視覚化デモサイト ※音量注意