banner
Olimi

Olimi

SCUT 小菜鸡
github
bilibili

文獻閱讀與組織:zotero使用總結

前言#

讀研這麼久,總算開始產出一點科研成果(bushi)。

從寫開題報告開始使用 zotero 閱讀文獻(ctrl+c, ctrl+v),到現在又半年多了。科研搞得基本沒啥動靜,嘆氣。

然後現在課題又進入廣調研、定方案的階段,看著我導打包發的上百篇參考文獻總算有點搞科研的樣子吧,嘆氣。

總得來說也是咂摸到搞科研的一些方法論,其實跟搞工程差不多,也是站在旁人的肩膀上,從學習別人的成果開始,大量閱讀、學習、使用和復現,總結提取相關競品的特點和缺點,然後進行需求分析,提出方案。

當然了,這篇幅是談文獻閱讀和組織,那主要是針對於這個過程裡面調研和學習的部分。與普通搞工程的不同,很多開源工程或庫的提供商都致力於實現可理解性、用戶友好性,都進行了高度的文檔化。但是搞科研就不同,內容多的是灌水,同時最核心的內容不一定開源,或者開源了也不一定就是所說的效果。畢竟科研講究的是創新。創新嘛,嘆氣。

科研垃圾的小小吐槽~

zotero#

主流的文獻組織管理器。其實也不算深度使用,大概記錄一下解決我的痛點問題和相關技巧。

所謂文獻就是一堆 pdf,原本也就是放在一個個文件夾裡。然後不斷打包下載,就有了好幾個文件夾,每個打開都十幾篇論文,頭大。

如果是剛開始從頭開始看,滿滿一個文件夾幾十篇也有點讓人沮喪,太多太亂!嘗試的做法是先粗度,然後提取抽象出一些分類和側重點,將他們分入不同的子文件夾中,然後再根據重心選擇一個方向對每篇細讀、精讀。示例如下:

image-20230129212309138

然後閱讀的過程就會涉及標註、做筆記和總結。當然了標註和註釋這些一般閱讀器都會提供,但是就要考慮所標註的這個文件必須要自己保留好、自己完成同步。畢竟論文其實獲取都是簡便的,但是對論文閱讀總結和提取的智慧結晶是寶貴的。然後是對同一篇、同一個子方向的多篇閱讀之後,提取核心內容,進行總結。這部分原本的做法是,一邊標註,一邊對論文內容重新組織,使用原本的概念或者重新抽象一個概念,根據這些概念拷貝論文中核心的內容,總結一個新的文檔對閱讀過的知識內容進行索引。示例如下:

image-20230129212334635

這個過程的體會來說,完成這個過程對於核心知識的理解、吸收和再索引效果都非常好。唯一的問題是耗時太長,無論是對理解的內容進行抽象和再組織,還是從原文獻把內容拷出來(直接拷貝的方法還有可能是內容過長)。同時跟文獻也是直接解绑的關係,相互跳轉有點麻煩。總結來說,感覺這種方式適合已經看完一個小方向的多篇文獻,對已經做好一些抽象、筆記的內容,特別是針對特別好的文獻,進行再組織,最後形成自己理解的知識內容,以後無需再逐一閱讀這些論文。

這裡就有一個需求,就是即時筆記和總結

還有就是再索引。剛剛說的這個過程,如果把學習的知識提取到自己的知識庫中,那索引就根據自己的知識體系進行即可,基本脫離文獻內容。但是像剛剛說的,耗時太長決定了不是所有知識都會被提取出來。一些不是那麼實用、或者對當前工作很重要的內容會被暫時搁置。但是以後可能想起這個內容,再想去找出這個知識的原出處就比較麻煩了,甚至直接忘記這個內容。所以對看過的內容,除了即時筆記,還要抽象出標籤,幫助以後迅速索引到不同特點、不同方向、不同內容的文獻。

以上就是文獻閱讀和組織的生命周期中的一些需求和相應的方案:

  • 分類使得文獻體系扁平化,能夠迅速專注於某個小問題上。
  • 及時筆記和總結讓我們只要閱讀了就能產出東西。記錄萬物的哲學。
  • 通過標籤和抽象實現體系化,方便進行以後的索引。

而上述這個過程就是 zotero 的核心理念(我自己理解的):

image-20230130104925098

  • 所有文獻作為一個條目放在文庫中,不同條目放入不同的分類中,分類又嵌套包含子分類。另外,一個條目可以放入多種分類,這是合理的,可以有不同的分法。
  • 點擊一篇文獻,右側顯示它的信息、筆記、標籤、預覽等。對其進行快速評估、索引和查找。
  • 論文閱讀過程(zotero 作為 pdf 閱讀器),可以標註和一邊做筆記。
  • 右下角直接篩選標籤。標籤可以使用某種顏色標記。
  • 條目和分類的概念跟普通文件夾管理有點不同,一篇文獻不會固定在某個地方。所以如果我們想查找的是跨分類的、或者查看該分類下所有條目包括子分類中的(父分類不會直接包含所有子分類條目),那可以使用高級搜索。搜索結果可以保存下來。

結合上述的需求分析和方案,以及 zotero 使用,目前個人整理的方案如下:

image

  • ** 首先是分類。** 將看過(粗看)的文章抽象一個概念放入相應的分類(可以同時放入多個分類)。
  • ** 然後是標籤。** 提煉幾個概念:星號標註收藏,標識有參考價值的好論文;已讀標註已經看過的論文;待看標註短期的 TO DO LIST 等。
  • 歸檔標籤下,按照時間順序歸類某個時間內看的論文集,最好最終分別產出一篇匯總筆記。
  • 固定一個包含該大分類所有文獻的高級搜索,就可以對該領域對所有收藏、已看、或其他看完後打上標籤的文獻進行定向索引。

其他的一些技巧。

插件#

有很多很好用的插件,擴展一些小功能。這裡我使用的:

  • ZotFile:自動重命名和在指定文件夾中關聯附件。主要與後者一起把已經打包下載好的文件,導入進來自動構建條目。
  • Jasmium:主要是抓取知網元信息。
  • Zotero PDF Preview:文獻預覽。
  • Duplcates Merger for zotero:自動去重。
  • Zotero PDF Translate:劃詞翻譯。

大部分的下載:Zotero 中文社區 (gitee.io)

同步#

官方提供的同步空間只有 300M,文獻數量一多就不夠用了。目前改為了堅果雲(每月 1GB 的上傳流量、單次上傳好像也是限制 300M 左右)。

方式就是在堅果雲創建賬號,在我的賬戶中賬戶安全添加第三方應用,把網址、賬戶密碼複製到 zetero 中。

image-20230129214234714

共享#

研究一個課題往往是一個小組多名成員共同完成。跟做工程類似,調研和閱讀文獻過程應該也能分工進行團隊協作。完全可以在對文獻分類後,每個人看其中一個小分類,完成上述的知識提取和再組織過程,然後分發、講解給團隊成員。

如果這樣的話,自然產生一個需求:共享同一套文獻庫的分類、組織和管理,共享筆記和標註,以及最後總結的知識庫。

比如上述對文獻整理的過程,包括粗讀、抽象概念和分類等,這些過程對同一批文獻做的工作都是一樣的,自然應該分工不讓每個成員都重複一樣的工作。

所以:只要打開 zotero 看到的東西都一樣就好辦。

** 方案:** 這就是群組的概念。zotero 中新建一個群組,跳轉到 web 端,選擇公開或私密的類型(都建議選擇 public, Closed Membership),設置一下即可。本地管理與普通文獻庫類似。

image-20230130102540435

** 問題:** 群組管理只能通過官方儲存庫,即只有 300M 的儲存空間。解決方案要麼購買更大的空間(但僅需管理員賬戶一人購買,其他人即可共享)。要麼轉為僅數據同步,即文獻庫的體系結構(這部分無上限),而文件同步,即文獻 PDF 等,通過其他第三方同步工具進行(然而安全、空間大、便捷性高的服務哪個不要付費嘞..)。下面是官方的說法

image-20230130105123633

載入中......
此文章數據所有權由區塊鏈加密技術和智能合約保障僅歸創作者所有。