愚問をてってれーするの楽しすぎるでしょβ

ESRのエッセイに唆されてPythonする初心者が半端な勉強ログを書き散らす場所 ICT文化にどうしても住みたいという遠大な啓示が下った人の住処/気持ちよさのためだけに/お客様のお忘れになった恥の概念が母胎に届いているようです

PyData. Tokyo Meetup #4のUstream見えなかったので他人のPCで見た

不具合を起こしてUstreamが安定して見られない。とりあえず開始から30分以上はただTwitter見てた。怖い情報で脅されたいと思って楽しみにしてたから折れない心。

 
今回のテーマは"データ解析アルゴリズムの高速化"ということ。
 
以下資料。データ分析用途でPythonを高速化、機械学習にNumPy、なるほど…?
 
 
 
日本語リスニング力テストとして聞いてるので本当にふわふわと、キーっぽい単語やフレーズを書き出す。
 
Cythonサイソンって読むのか。
BDAS Spark velox
 
FORTRAN時代からPythonBLASというものを読んで数値計算している。
 
49枚目からは"泥くさい"表記時の工夫の話らしい。
50枚目、やったら"ぶちころすぞ"という事らしい。
 
数値計算は自分で実装しない
Python数値計算はfor文書いてはだめ
 
####以下2つめ####
 
 
本当はSciPyの紹介もするはずだったけど、時間の関係上削ったということで、NumPyなどモジュールを使うことでCと同程度の速度を実現できる。
NumPyの中でどういうことしてるんですか?→NumPyのソースコード読んでないので分からないです。
 
Boolean(ぶーりあん)。Pandas(ぱんだす)。
flat。(スライド19枚目上から3つ目のブロックに訂正、K. FlatからKへ)
 
NMF。scikit-learn、sklearn(さいきっとらーん)。何かがNatureに掲載されたとか。ノンネガティヴ。
 
ラムダノピー。
 
norm(のるむ)。ろじかるおあ。
normの実装が気持ち悪い、それに関しては有名な良ブログ記事があるそう。

とにかく、なるべくSciPy/NumPyを使い、自分では数値計算を書かないのが原則、という部分の結論が最初の発表者と一致していたんじゃないかな。

Code-reading。