Numpy、OpenCV、PyAutoGUIを用いてデスクトップ画面をキャプチャ(録画)するソフトを自作する
※pythonの勉強法とその手順を記事にしました。
※2020年11月29 「3.4 前準備3:スクリーンショットの画像の大きさを取得」を追記しました。具体的にはどんなモニタを使用していても動くようにコードを改良しました。またその他のファイル形式で保存する方法を追記しました。
1. はじめに
デスクトップ画面を録画したいと思ったことはありませんか?
私は時々思います。特にブログで自作アプリの動作を紹介する時に画像ではなく動画で説明できれば分かりやすいのになと思うことが多々あります。
しかしフリーの動画キャプチャソフトは時間制限があったりロゴが勝手に入ってしまったりと使い勝手が悪く、あまり乗り気じゃありませんでした。
そこで「それならpythonで作ってしまおう」ということで、今回、本当に簡易ではありますがキャプチャソフトを自作してみましたので、コードと動作を紹介します。
2. コード
上記を実行すると記事冒頭のGIF画像のように、10秒間デスクトップ画面が録画されて.mp4で動画ファイルが作成されます。
3. 説明
3.1 必要なライブラリのインストール
まず必要なライブラリを上の5つになります。
① numpy:画像のデータ(配列)を扱うため
② cv2(OpenCV): 配列&動画作成をするため
③pyautogui:スクリーンショットを撮るため
④os:画像格納用のフォルダを作成するため
⑤time:フォルダ名に使用するため
ここでAnacondaを使っていれば、①numpy、④os、⑤timeは予めインストールされています。一方、②cv2と③pyautoguiは自分でインストールする必要があります。
インストール方法は以下2つの過去記事をご覧ください。
3.2 前準備1:保存先として新しいフォルダ作成&名前
今回、スクリーンショットを大量に作成し、それを繋げて動画を作成します。
その大量のスクリーンショットを保存するためのフォルダとして、makedirs()を使って新規フォルダを作成します。
またフォルダの名前は「formovie+コードを実行した時間」としています。実行すると次のように新しいフォルダができます。20200508-233410は2020年5月8日-23時34分10秒という意味です。
3.3 前準備2:動画作成で使う変数を準備
img_listは大量のスクリーンショットの情報を保存するためのリストです。
img_Noは各スクリーンショットの名前に番号を付けるための変数です。以下画像のマーカーのように名前末の番号として使われます。
FPSは動画のフレームレートに使う変数です。FPSとは1秒間に何枚の画像を表示するかで、FPS=14は1秒間に14枚の画像を表示するという意味になります。
movie_timeは動画時間になります。movie_time=10は10秒の動画という意味になります。
photo_noは上記FPSと動画時間を満たすために何枚のスクリーンショットを撮れば良いかの変数になります。
3.4 前準備3:スクリーンショットの画像の大きさを取得
事前にスクリーンショットの解像度を.shapeで取得しておきます。
これはスクリーンショットの解像度はモニタの大きさで変わるからです。例えばFullHDのモニタを使ってる人は1980×1080、4kのモニタを使ってる人は3840×2160であり、次の3.5で動画にする際にこのスクリーンショットの解像度が必要になるからです。
3.5 動画作成用のスクリーンショットを大量に撮る
for文を使ってスクリーンショットの画像を大量に集めます。
img_No=img_No+1は以下のように画像ファイルの名前を連番にするためにfor文で1づつ足しています。
次にscreenshot()でスクリーンショットを撮ります。
このままではopencvで扱えないので、opencvでも扱えるようにasarray()でnumpyの配列に変換します。
この時、配列の順番がPILだとRGBなのに対しOpenCVはBGRなので色が変になります。そこでcvtColor()を使ってRGBからBGRに変換しています。
img_outputは画像ファイルの名前となる変数です。
最後にcv2.imwrite()で画像を保存し、img_listにappendで画像の情報(画像の保存場所)を加えます。
これを終わるまでfor文で何度も繰り返します。すると新しく作った「formovie+コードを実行した時間」の名前のフォルダ内に、大量にスクリーンショットが保存されます。
3.6 動画を作成する
まず動画の拡張子をcv2.VideoWriter_fourcc()で決めます。今回はMP4にします。
例えばaviにしたい場合は、('D','I','V', '3') とします。
次に動画となる箱として変数videoをVideoWriter()で作ります。引数は、動画ファイルの名前、動画の拡張子、動画のフレームレイト、動画の解像度です。
※ここで動画の解像度は写真の解像度と一致していないとエラーになるので注意してください。どういうことかというと、私は1920×1080のモニターを使っているのでスクリーンショットの画像の解像度は1920×1080です。なのでVideowriter()でも(1920,1080)としています。
次にfor文を用いて、imread()で保存した画像を再度読み出し、先ほど作った動画となる箱の変数videoに1つ1つ画像を書き込んでいきます。
最後にvideo.release()をしたら次のようにmp4の動画が作成されます。
3.7 おまけ:動画のファイル形式
今回、動画のファイル形式はmp4ですが、fourcc = cv2.VideoWriter_fourcc('m','p','4', 'v')の中身を変えることでその他形式でも保存が可能です。
例えば、
①.wmvで保存したい場合は、('W','M','V', '1')
②.aviで保存したい場合は、('M','J','P', 'G')
などです。
おすすめ書籍
PyAutoGUIやOpenCVの使用方法が載っている書籍を紹介します。
この3つは非常に丁寧に書かれているのでお勧めです。
「Pythonで始めるOpenCV入門」と 「PythonでGUI自動化しよう」については、Amazonの月額読み放題サービス「Kindle unlimited」に加入していれば読み放題です。
初回30日間は無料、退会も簡単なので試しに読んでみてもよさそうです。
4. 最後に
いかがだったでしょうか。
ちょっとした画面キャプチャとして使えるので便利です。