Tuesday, December 27, 2005

國圖資料遭駭?

看到資安人的電子報一個聳動的標題「 國圖資料遭駭,尊重著作權應站在學術自由之前」,進去看看詳細內文,才發現有讀者使用破解 PDF 密碼的方式,解除該網站上博碩士論文 PDF 檔的複製鎖定功能,其實解除 PDF 密碼保護的軟體很早就存在,根據該軟體的說明,PDF 有兩種密碼鎖定方式,一種很容易的複寫密碼區,將空白密碼寫到該區就形同沒有密碼保護;另一種則需要用猜密碼的方式來破解,但對於不簡單的密碼則需要花費大量的時間。

其實較厲害的駭客或許可以直接讀取 Acrobat reader 的記憶體來取得解碼後的資訊;比較笨的方法可以將論文列印後,使用 OCR 程式來轉成文字檔,只是還需要多一道校對的工作。如果真要抄襲的話,直接重打一次也不用花太多精神。抄襲他人已發表的文章並不是件新鮮事,只要拿得到資料就可以抄襲,不一定要電子檔,差別只是容易的程度而已。所以有些資訊科學家研究抓抄襲的程式,比對學生繳交的作業、報告等資料和網路上的現有資料,將比對的工作自動化,這或許是較實際可行的方式。

Sunday, December 25, 2005

捐書給圖書館

上篇文章提到追蹤捐書給陌生人的一個方法,但是關於讓書充分被利用,最有效的方式就是捐給圖書館,尤其是公共圖書館。

記得有幾年前讀過美國一份報紙的報導,呼籲讀者捐書給圖書館。如果你是愛買書的讀者,有想充實住家附近的公共圖書館,捐給圖書館是一個非常好的構想。除了 參考書、工具書和經典的駐作外,大部分的書並不值得一再閱讀,但是值得一讀,例如大部分的小說或暢銷書,如果書架空間有限不想收藏,但是附近的圖書館卻尚 未採購,而你想閱讀時,有什麼好的解決方式了? 就是捐給圖書館。你可以先跟圖書館查詢確認圖書館尚未採購或處理中,然後買書來捐給圖書館,為了確保你可以先睹為快,請圖書館先幫你預約或是讓你是處理後 的第一個借閱者,這樣既可充實圖書館的館藏,也可以讓你認為有用的書可以獲得較大的利用,充分發揮書的利用價值,而不是僅置身於你的書架上積灰塵。

如果你認為這是不錯的構想,而且有些可使使用的經費,何不捐輸給圖書館呢?不論是公共圖書館或是附近學校的圖書館,除了已有多筆複本外,一般都很歡迎讀者 的捐書。對於一些暢銷書,甚至有許多讀者排隊要閱讀,捐書給圖書館除了可以發揮你的愛心外,還可以減少圖書館讀者的抱怨,減少圖書館員在聽到抱怨後的壓 力,讓整個社會更加和諧,和樂而不為呢?

盡量利用看過或不用書

想讓塵封已久的書再被利用嗎? 今天看到一個奇怪的網站,當你不要一本書或是不想重看時,可以給你的親戚朋友、捐給圖書館或是給陌生人。給陌生人的方式之一是將書留滯在公共場所等待有心的讀者來充實知識或好奇心,但是你怎麼知道這本書稍後流落何方呢?

該 網站的目的就是提供一個追蹤該書籍的方式,你可以在該網站上登錄該書,取得一個 BCID (bookcrossing ID),紀錄在書上,然後挑選一個放置的地點,將書放在挑選的地方並註明是免費增送,這樣你的任務就完成了,接下來就等待好奇的讀者來取書。若第n代無聊 的讀者在bookcrossing網站登陸資要後,你就知道你的書現在流落何方了。

如果你是位窮讀者,你也可以上該網站找書,看看住家附 近有沒有向閱讀的需要主人的孤兒書,然後盡快去取書以免讓其他讀者捷足先登,然後上網登記讓原主人知 道他的錢可以獲得最大的利用。當寫此文章時,在台灣只有一本流量中的書有登記,位於中正國際機場國泰航空的休息室內,請愛書者去認養。

Wednesday, December 21, 2005

電子紙

Wired 報導德國西門子(Siemens)展現一種電張厚度的電子顯示技術,價格便宜到可以用在包裝的外盒上,例如牛奶盒或餅乾盒。西門子說兩年內這種技術可以將固定的包裝盒上印刷變成動畫顯示,如此可以吸引小孩或青少年的吸引力,突顯使用該技術的產品。
使用該技術製造的電子紙需要使用低電壓電力才能顯示文字或影像,預估到2007年解析度可以達到80dpi,可以輪流展現三種影像,產生原始的動畫效果,到2008年解析度可以倍增。該技術目前還無法成為縮小的螢幕,因為更換影像的速度太慢。
以 1x2 英吋的電子紙為例,柯達(Kodak)的技術約需要40美元的成本,但西門子的成本約30美分,低廉的成本是西門子技術擁有的一項優勢。

免費有聲書

根據 wired 的報導,Hugh McGuire 在搜尋免費的有聲書 (audio book) 未果後,突發奇想創立 LibriVox 免費有聲書網站,他的構想跟 Project Gutenberg 相似,請志願者建立文學作品的聲音檔,這些文學作品必須沒有版權問題,每個人可以認養一個章節來朗讀,然後上傳檔案到 Internet Archive 的主機,提供的檔案格式是 MP3 和 OGG。
目前該網站已有26部長短文和詩的有聲書,預計年底前會有30部有聲書,不過都是英文書,不知道有沒有類似的中文有聲書計劃?

文件安全

大部分的使用者可能知道文件的 metadata,例如 Word 文件自動包含作者姓名、機構、日期和修改歷程等資訊,PDF檔案亦含有類似的資訊,metadata對於文件的維護和搜尋有相當的助益,但是對於較機密的文件,也可能洩漏出一些不想讓外人知道的訊息。
例如美國 Bush 的演講 Our National Strategy for Victory in Iraq 文件中透露出原始的著者是 Duke University 的 Peter D. Freaver,其他還有許多因為metadata透露出的資訊而造成的當事人困窘的例子。
微軟發表如何移除Office文件metadata的網頁,Trace 是一個移除 M$ Office 文件metadata 的免費工具,有興趣的讀者可以玩玩看,但該工具最新2.0版只支援英文版的作業環境。

賽門鐵克防毒軟體漏洞

根據 Security Fix 的報導,賽門鐵克防毒軟體在處理 .rar 壓縮檔時有漏洞,可讓特別產生的 rar 壓縮檔在解壓縮時執行病毒或蠕蟲,允許侵入者控制整台電腦。如果使用者設定自動掃描收進來的信件,使用者電腦可在使用者不知情的狀況下被駭。幾乎所有賽門鐵克的防毒軟體系列都受到影響,目前賽門鐵克尚未釋出修補檔,但表示尚未發現有利用此漏洞的病毒或蠕蟲,只建議使用者不要自動掃描 RAR 檔。

Friday, December 16, 2005

how to make mp4 for streaming

Use ffmpeg, FAAC and MPEG4IP to make mp4 for streaming

  1. To extract the audio track from the source

    ffmpeg -i input_file -vn output_file


  2. To encode the raw PCM audio track split by FFmpeg: (use FAAC)

    faac -m4 -b64 -r48000 -pLC input_file output_file # for older version
    faac -m 4 -b 123 input_file output_file # for newer version

  3. encoding to ISO MPEG-4 video (bitrate: 300 kbps):
    • One pass

      ffmpeg -i input_file -an -b 300 -vcodec mpeg4 output_file


    • first pass

      ffmpeg -i input_file -an -pass 1 -passlogfile log_file -qscale 2 -vcodec mpeg4 output_file

      second pass

      ffmpeg -i input_file -an -pass 2 -passlogfile log_file -b 300 -vcodec mpeg4 output_file

  4. Multiplexing: combining the Audio and Video (using MPEG4IP)
    adding a video track

    mp4creator -c myvideo.avi -hint mytest.mp4

    adding a audio track, -interleave not needed for MP3

    mp4creator -c myaudio.aac -hint -interleave mytest.mp4

    optimize it

    mp4creator -optimize mytest.mp4
After that, you can use Darwin Streaming Server to stream the MPEG-4 clip.

Ref: Streaming MPEG-4 with Linux, 2003-03-13

Thursday, December 08, 2005

心得 - Planning and developing new Models for Academic Libraries

Planning and developing new Models for Academic Libraries – Thinking differently

Steve O’Connor, Nov. 15, 2005 于淡水

心得


傳統學術傳播模式是作者將研究成果投稿到出版社,圖書館向出版者購買,讀者再到圖書館取用。新的傳播模式可能是作者經由 Open Access (OA) 模式將研究成果放到圖書館 IR (Institutional Repository 或機構典藏),讀者從 IR 取用,或是作者直接放在個人網站供讀者取用;讀者也可能直接向出版者購買或取用,例如 ebooks 等 pay per view 式的電子書或 Google Print,出版社跳過圖書館直接面對讀者,有些出版社甚至允許讀者購買一個章節。

Open Access 是這波改變的推手之一,也是爭議的焦點。OA的一個觀點是作者付費給出版社出版,但這是長久可行的模式嗎?每篇文章的平均價格受到拒絕率、格式(紙本或電 子版)和品質等因素的影響。若加上對於經費短缺的作者和公司的免費策略,每篇文章的費用要增加33.3%和16.6%=50%,以 Science 為例每篇需要收取美金$15,000,高得很難讓計劃經費提供者接受。

網際網路造成的另一個衝擊是“長尾巴” (Long Tail) ─ 舊資料的被利用,因為網路的便利性,讀者可以很快取得舊資料,例如音樂界的線上音樂或圖書界的POD (隨需印刷),及舊期刊資料在上線後仍有少數的讀者會去取用等。

未來學術圖書館模式:1. 需要儘可能參與數位型式的學術出版。2. 建立機構的數位典藏是必要的。3. 提供各種數位資源,但所有服務都以數位方式提供。

為了避免實體圖書館這項優點變成弱點,要跟其他圖書館合作來確保資源可以有效的被利用,合作方式包含編目資源、技術分享和分享低用量資料的儲存等。

教學方面,注重教學資料搜尋的整體參與,建立和支援學生的學習資源。

驅動未來學術圖書館的原則:1. 流程作業、典藏和實體圖書館是傳統的優勢,但可能變成最大的弱點。2. 重視分享技術服務和祖傳的典藏,不要忽略網際網路和 Google 這樣的競爭者,否則會煙消灰散。3. 不要根據主觀的認知,否則無法迎合讀者的需求。

看 得到的未來有:1. 未來的模式不是無限可能,但是有許多可能。2. 記得未來已經非常近了,而且是變動的。3. 館藏有未來嗎? 4. 出版社也有其他管道? 5.尋找合作夥伴,不要事事親自包辦。6. 規劃是必須的。7. 需要有冒險患難的精神,不要猶豫。8. 知識是重要的、判斷是關鍵性的。