Python高速化メモ

pythonで高速化するときの自分用のメモ

基本的な心得とか

無駄な処理はしない。複雑な処理を書かない。
自作しない。自分で書くよりライブラリ使った方が速い場合が多い。
HDDは糞。ディスクI/Oは減らすべき。sqlite3も必要ない場合はメモリ上で動かす。

よく参考にするサイト

https://x1.inkenkun.com/archives/861

並列化

高速化が目的の場合に一番手っ取り早いのが並列化。

pythonで高速化目的の並列化を行う場合はマルチスレッドではなく、マルチプロセスで動かすべき。pythonのマルチスレッドだと、同一コアで動作するのでマルチコアの優位性を生かせない。なので、CPUをぶん回していいなら断然マルチプロセス。

でも一番バグが発生しやすいのも並列化。以下のことを心がける。

並列化した実行プロセス同士は同期させない。同期させないような処理の分け方にしておく。
どうしても同期が必要な場合は排他制御を行う。排他フリーの同期ロジックを思いついたって？安心してください、それは幻想です。
どうしてもプロセス間でデータのやり取りが必要な場合はmultiprocessing.Queue()等を使う。自作はしない。ただし、プロセス間でデータをやり取りすると、pythonオブジェクトのpickle/unpickleが走るので巨大なデータをやり取りすると目に見えて遅くなる。