勉強
AndroidでHackerNewsリーダー作った 作ったもの HNReader - Google Play の Android アプリ Google Playで"Hacker News"と検索すると似たようなのがたくさん出てくる 何個か試してあんまりしっくりこないし自分で作りたいな、と思っていた それに加えていろ…
第Ⅰ部データベース論理設計のアンチパターンのメモ ジェイウォーク リストをカンマ区切りの文字列としてDBに格納すること 属性が複数の値を取る場合のデータの扱い方 交差テーブルを作成する 非正規形のテーブルは扱いにくいので、多対多の関係が生じるなら…
行列の計算 import scipy.sparse as sp import numpy as np a = sp.lil_matrix((1, 10000)) # 1*10000の疎行列が作成される b = sp.lil_matrix((1, 10000)) # a.shape => (1, 10000) for i in xrange(a.shape[1]): r = np.random.rand() if r < 0.9: r = 0.0…
SimpleCursorAdapter Androidアプリ開発において、ListViewにデータを渡すために用いられるアダプターの1つ。 ArrayAdapterなんかが一般的だが、これはコンストラクタに表示したいデータを渡してあげなければならない。 SQLiteなどのDBから特定のデータを取…
論文を読んでいて出てきたのでメモ書き程度に。 SIRモデルについて Wikipediaによると、モデル名は、モデルの変数である 感受性保持者 Susceptible 感染者 Infected 免疫保持者Recovered (あるいは隔離者 Removed) というこれらの頭文字に因む、らしい。 他…
言語モデルで情報検索 言語モデルを情報検索に用いる流れは, 文書を生成モデルとみなして,クエリもそれによって生成されるものとする. 上の生成モデルを定義する. それを評価する. クエリを最も生成しそうな生成モデルである文書を見つけ出す. その文書を結…
再現率・適合率 前回のエントリの引用. Precision:適合率 検索結果に適合しない文書が入ってない割合 Recall:再現率 適合する全ての文書の内,どれだけ拾うことが出来たかの割合 計算式は以下の表を用いて Relevant Nonrelevant Retrieved tp fp Not Retrieve…
IIR第8章 テスト Search Engineをどうやって評価するのか. インデックス作成の速さ 検索の速さ クエリ作成の自由度 ユーザーインターフェース 無料? といったところ. まず 速さや時間といった定量的なもの についての評価は容易い. しかし,重要なのは ユー…
IIR第6章 第6章 Ranked Retrieval 第1章で取り扱ったboolean検索の問題点を解決するために, Ranked retrieval:ランキング検索を考える. boolean検索の問題点 検索queryを書くのが難しい. 検索結果が多すぎるor少なすぎる (andは減らしすぎ,orは増やしすぎる)…
Introduction of Infomation Retrieval(IIR)について 適当&もしかしたら間違ってる,なんで参考にして失敗しても責任とりませんので悪しからず. 第一章 Information Retrieval(IR):情報検索 IRは膨大なデータのcollectionから欲しい情報を持つunstructed natu…