勉強

勉強したかったことを盛り込んでアプリ作った

AndroidでHackerNewsリーダー作った 作ったもの HNReader - Google Play の Android アプリ Google Playで"Hacker News"と検索すると似たようなのがたくさん出てくる 何個か試してあんまりしっくりこないし自分で作りたいな、と思っていた それに加えていろ…

SQLアンチパターンのメモ1

第Ⅰ部データベース論理設計のアンチパターンのメモ ジェイウォーク リストをカンマ区切りの文字列としてDBに格納すること 属性が複数の値を取る場合のデータの扱い方 交差テーブルを作成する 非正規形のテーブルは扱いにくいので、多対多の関係が生じるなら…

Scipyでの疎行列の扱い

行列の計算 import scipy.sparse as sp import numpy as np a = sp.lil_matrix((1, 10000)) # 1*10000の疎行列が作成される b = sp.lil_matrix((1, 10000)) # a.shape => (1, 10000) for i in xrange(a.shape[1]): r = np.random.rand() if r < 0.9: r = 0.0…

SImpleCursorAdapterについて

SimpleCursorAdapter Androidアプリ開発において、ListViewにデータを渡すために用いられるアダプターの1つ。 ArrayAdapterなんかが一般的だが、これはコンストラクタに表示したいデータを渡してあげなければならない。 SQLiteなどのDBから特定のデータを取…

SIRモデル、パワー則

論文を読んでいて出てきたのでメモ書き程度に。 SIRモデルについて Wikipediaによると、モデル名は、モデルの変数である 感受性保持者 Susceptible 感染者 Infected 免疫保持者Recovered (あるいは隔離者 Removed) というこれらの頭文字に因む、らしい。 他…

Information Retrieval-12章

言語モデルで情報検索 言語モデルを情報検索に用いる流れは, 文書を生成モデルとみなして,クエリもそれによって生成されるものとする. 上の生成モデルを定義する. それを評価する. クエリを最も生成しそうな生成モデルである文書を見つけ出す. その文書を結…

再現率・適合率

再現率・適合率 前回のエントリの引用. Precision:適合率 検索結果に適合しない文書が入ってない割合 Recall:再現率 適合する全ての文書の内,どれだけ拾うことが出来たかの割合 計算式は以下の表を用いて Relevant Nonrelevant Retrieved tp fp Not Retrieve…

Information Retrieval-8章

IIR第8章 テスト Search Engineをどうやって評価するのか. インデックス作成の速さ 検索の速さ クエリ作成の自由度 ユーザーインターフェース 無料? といったところ. まず 速さや時間といった定量的なもの についての評価は容易い. しかし,重要なのは ユー…

Information Retrieval-6章

IIR第6章 第6章 Ranked Retrieval 第1章で取り扱ったboolean検索の問題点を解決するために, Ranked retrieval:ランキング検索を考える. boolean検索の問題点 検索queryを書くのが難しい. 検索結果が多すぎるor少なすぎる (andは減らしすぎ,orは増やしすぎる)…

Information Retrieval-1章

Introduction of Infomation Retrieval(IIR)について 適当&もしかしたら間違ってる,なんで参考にして失敗しても責任とりませんので悪しからず. 第一章 Information Retrieval(IR):情報検索 IRは膨大なデータのcollectionから欲しい情報を持つunstructed natu…