Posts

Showing posts from October, 2013

在 blogspot 顯示數學符號

在blogspot 上想顯示 $\delta$, $\frac{a_{2}}{b_{1}}$ 這類數學符號時,需要透過 MathJax 的 javascript 支援。網路上找了一段: <script type="text/javascript" src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"> MathJax.Hub.Config({  extensions: ["tex2jax.js","TeX/AMSmath.js","TeX/AMSsymbols.js"],  jax: ["input/TeX", "output/HTML-CSS"],  tex2jax: {      inlineMath: [ ['$','$'], ["\\(","\\)"] ],      displayMath: [ ['$$','$$'], ["\\[","\\]"] ],  },  "HTML-CSS": { availableFonts: ["TeX"] } }); </script> 個人是將他貼到 template 去,雖然有人建議可以產生一個 javascript webgadget 可嘗試後仍失敗。 另外針對 latex math symbol code也可以到 這裡 查詢。

Introduction to Recommendation - 關於 TFIDF

這次上課主要介紹 TFIDF [原由]  primitive search engine 中, 當user 對某些term做搜尋, 得到的是所有包含這個 term 的結果. 能否根據 documents 中的 term 出現頻率將搜尋結果排序?  問題1: 當user 輸入 "civil" "war", 可能 "civil" 比 "war" 來的有意義.  問題2: user 輸入 "civil" x 10000 跟 "war" x 15000 可能沒多大意義 [定義]  TFIDF = Term Frequency * Inverse Document Frequency  TF: 一個 term 在 一份 document 中出現的次數  IDF: 這個 term 在 documents 中有多稀有 [用途]  1. create a profile of a document/object  2. this TFIDF profiles can be combined with rating to create user profiles, then match against the future profiles. [Variants and alternatives]  1. 0/1 boolean frq  2. Log (TF+1)  3. normalized frq. [document length] [可能遇到的問題]  1. core term/concept 沒被使用  2. poor search [TFIDF的限制]  1. Phrase and n-grams - 像是computer science 不等同 computer 跟 science  2. significance in documents - title, tag, heading 覺其他 term 更有意義  3. general document authority - 像是 google的 pagerank 跟 movie 的 rating 等訊息  4. implied con