2009-01-01から1年間の記事一覧
追記(2010/11/01): twitterではBasic認証が廃止されてしまったので、以下の方法ではAPIが使えななっています。いずれOAuth認証ネタでも書きたいところですなぁ。。。 とあるネタでTwitter botを作る事になった。 pythonで作ったので、その時のメモなど。 目…
Python、特にSciPyは日本語でのドキュメントが少ないので、メモがてら記述。 単語文書行列などでは大規模疎行列になることがよくある。 そこで格納方法の工夫などを行っていく必要がある。 最もスタンダードな方法としては圧縮行格納方式などがある。 基本的…
自然言語処理の技法の1つに、潜在的意味解析(LSA)というものがある。 単語文書行列Aがあった場合、特異値分解(SVD)により A=UΣV に分解し、特異値を大きいほうからk個使って Ak=UkΣkVk のように階数の低減を行うことで、階数kのAへの近似を最小誤差…
【追記】暗号化→認証コード生成に修正 2009/08/29ハッシュ関数を用いて「秘密鍵」と「認証すべき任意長のメッセージ」から暗号認証コード(MAC値)を生成する。HMACの詳細はHMAC(by Wiki)で。 まずはこの記事から引用(一部改変) import javax.crypto.*; impo…