とりあえず自分の中で一段落したので公開してみる。 匿名ダイアリーで書いたけど、せっかくなのと修正したついでにこっちで改めて掲載。 作ったアプリ http://helpetit.com 読み方はへるぷっちです。 動画で暇つぶしするためのWebアプリです。 動機:暇つぶ…
シンボリックリンクが自分自身を参照している時は # /home/hoge で ls -l すると hoge -> /home/hoge/fuga となっている # シェルスクリプトの記述ミスでこうなってしまった...。 touch temp #空ファイル作成 mv fuga piyo #piyo -> /home/hoge/fugaとなる #…
javascriptのリロード Ajaxで画面の一部を更新したとき、その部分に影響するjQueryプラグインがきちんと動作しなくなることがあったので、 それを改善するためにそのjQuery(js)ファイルを再読込みすることで対処しました。 具体的には videobox.jsを使ってい…
webページの認証について .htaccessと.htpasswdを編集する .htpasswd su - htpasswd -c /etc/httpd/conf/.htpasswd hogehoge # パスワードを2回求められるので入力 cat /etc/httpd/conf/.htpasswd hogehoge:xxxxxxxxxxxxxx # 暗号化されているこれで.htpassw…
さくらのVPS (1G)を借りたのでその設定メモ 初めてのサーバ設定ということでかなりつまづいて時間かかったのである程度ログを残しておく 初期設定いろいろ root以外のユーザー作成 rootログインの禁止&sudoの有効化 ssh設定(ポート番号、rootログインの禁止)…
MeCabで使う辞書を編集したいけど権限が無くて編集できないときの対処法 mecabrc ~/.mecabrc を作成し,/usr/local/etc/mecabrc の内容をコピーして // ; userdic = /home/foo/bar/user.dic userdic = ~/user_dic/hoge.dicと書き換える.セミコロンも消す. …
javascriptとjqueryの練習に簡単なゲーム書いてみた. 勝ち判定の条件分岐がぐちゃぐちゃだけど気にせず. googledriveでwebページを公開できるらしいのでそのテストも兼ねて.※Chromeでも動くように更新(2/14) ○×ゲーム
Pythonで日付表現を扱いたい時のメモ書き 日付の入った文字列を日付表現にすることが一番面倒臭い import datetime # 今日 datetime.date.today() # >>> datetime.date(y, m, d) # 今日の今 datetime.datetime.today() # >>> datetime.datetime(u, m, d, h, …
行列の計算 import scipy.sparse as sp import numpy as np a = sp.lil_matrix((1, 10000)) # 1*10000の疎行列が作成される b = sp.lil_matrix((1, 10000)) # a.shape => (1, 10000) for i in xrange(a.shape[1]): r = np.random.rand() if r < 0.9: r = 0.0…
SimpleCursorAdapter Androidアプリ開発において、ListViewにデータを渡すために用いられるアダプターの1つ。 ArrayAdapterなんかが一般的だが、これはコンストラクタに表示したいデータを渡してあげなければならない。 SQLiteなどのDBから特定のデータを取…
論文を読んでいて出てきたのでメモ書き程度に。 SIRモデルについて Wikipediaによると、モデル名は、モデルの変数である 感受性保持者 Susceptible 感染者 Infected 免疫保持者Recovered (あるいは隔離者 Removed) というこれらの頭文字に因む、らしい。 他…
決定木を生成するアルゴリズムの C4.5 を実装したアプリケーションを Macで使えるようにするためのメモ. ダウンロード ここからダウンロードしましょう. 圧縮ファイルのあるディレクトリに移動して tar -xvzf c4.5r8.tar.gz cd R8 ファイルの修正 R8/Srcに…
データベースとしてsqlite3を使用していて,すごく今さらながら最近知ったことがあったのでメモ. エスケープ処理 pythonで文字列を扱うときに,例えば\(バックスラッシュ)を print '\'なんてすると怒られるのは,pythonにおいて \ がエスケープに用いられて…
研究室の勉強会で正規表現と自然言語処理について話したのでそれのまとめ. 正規表現 クロールしたWebページのテキストから時間に関する部分だけを抽出したい, といった時に機械的にパターンに当てはまる部分を抽出するための表現. メタ文字 .:任意の一文…
TeXで論文を書く機会があったのでいろいろメモ. 用意するもの このページ(Mac - TeX Wiki)が非常に参考になるかと思います. まずMacでtexを使う際によくおすすめされていたのがMacTeXです. 上のページにミラーがありますが,ここ(MacTeX)からもダウンロー…
pythonでクローラを作ってて,Googleの検索結果のページを使えるようにするためにちょっと工夫が必要だったのでメモ. urllib, urllib2 pythonでwebページの情報を利用とするとなると, urllib urllib2 のどちらかを使うことになるかと思います. 基本的には…
この記事(2011-11-08 - I/O Error : My Knowledge)で 三項演算子について軽く書いて,自分で使ってみてると上手くいかないことが起きたのでメモ. コード例 from random import randint def r(): i, j = randint(-10, 10), randint(-10, 10) print 'i =', i, '…
FizzBuzz なんとなくFizzBuzzとかやったり解答例FizzBuzz - Pythonのお勉強を眺めてると for i in range(100):print i%3/2*"Fizz"+i%5/4*"Buzz"or-~iというワンライナーを見つけて, ~iって何だよ,ってなって調べてみた. ビット演算子 Pythonにはビット演算子…
PIL 前回のエントリ (Python Image Library(PIL)の使い方 - I/O Error : My Knowledge)では import Imageとしていましたが、きちんとしたPILのインストールを行ったのでメモ。 ダウンロード まずはPILの公式サイト(Python Imaging Library (PIL))から ソース…
またしてもpython chanllengeです. PILを用いることになったのでお勉強. 今回はコードとして全部書いてしまいました. PILを用意 easy_install PILもしくは pip install PILとかでいけるはずです. easy_installとかpipについてはググッてください. 用意した物…
python challengeでzipfileを使うことがあったので. まずは import zipfileでインポートする. ZipFileオブジェクトの扱い 扱う対象をchannel.zipとする.(python challengeより) s_zip = zipfile.ZipFile("channel.zip", "r")でzipオブジェクトとして扱えるよ…
言語モデルで情報検索 言語モデルを情報検索に用いる流れは, 文書を生成モデルとみなして,クエリもそれによって生成されるものとする. 上の生成モデルを定義する. それを評価する. クエリを最も生成しそうな生成モデルである文書を見つけ出す. その文書を結…
正直どうでもいい上にめっっっちゃ簡単なことを調べてみたので一応. 調べたこと 例えば今 n = 1 として, n に 2 をしたい時に n += 1とするべきか, n = 2とするべきか. 調べ方 変数を1増やしたい時にどっちがいいかを判定するために, pass(何もしない) 1大き…
最近PythonChallengeにほんの少し取り組んでいて,そこで 初めてPickleモジュールを使うことになったのでメモ. pickleとは python特有のデータ形式のことであり, ざっくり言えばバイナリで保存するのではなく, 全部文字列にして扱いましょう,っていう感じだと…
ファイル読み込み コード内で既に存在しているファイル(例えばinput.txt)を開きたい時に, f = open("input.txt").readlines() とやっても, g = [line for line in file("input.txt")]とやっても結果は同じ. というかfileとopenの違いが分かりませんでしたw …
再現率・適合率 前回のエントリの引用. Precision:適合率 検索結果に適合しない文書が入ってない割合 Recall:再現率 適合する全ての文書の内,どれだけ拾うことが出来たかの割合 計算式は以下の表を用いて Relevant Nonrelevant Retrieved tp fp Not Retrieve…
IIR第8章 テスト Search Engineをどうやって評価するのか. インデックス作成の速さ 検索の速さ クエリ作成の自由度 ユーザーインターフェース 無料? といったところ. まず 速さや時間といった定量的なもの についての評価は容易い. しかし,重要なのは ユー…
IIR第6章 第6章 Ranked Retrieval 第1章で取り扱ったboolean検索の問題点を解決するために, Ranked retrieval:ランキング検索を考える. boolean検索の問題点 検索queryを書くのが難しい. 検索結果が多すぎるor少なすぎる (andは減らしすぎ,orは増やしすぎる)…
Introduction of Infomation Retrieval(IIR)について 適当&もしかしたら間違ってる,なんで参考にして失敗しても責任とりませんので悪しからず. 第一章 Information Retrieval(IR):情報検索 IRは膨大なデータのcollectionから欲しい情報を持つunstructed natu…