文獻檢索是科研的基本功, 閱讀文獻是科研人員獲取科研信息的重要途徑。評價文獻檢索質量的兩個最重要的指標是查全率和查準率。
查全率指的是檢出的相關文獻量與系統文獻庫中相關文獻 總量的比率,它反映該系統文獻庫中實有的相關文獻量在多大程度上被檢索出來。查全率 = 檢出相關文獻量 / 文獻庫內相關文獻總量× 100% 。查準率指的是是指檢出的相關文獻量與檢出文獻總量的比率,是衡量信息檢索系統檢出文獻準確度的尺度。查準率 = 檢出的相關文獻篇數/檢出的全部文獻篇數× 100%。
查全率與查準率在一定程度上是成反比關系的,為了提高查全率就要以犧牲部分查準率為代價,反之亦然。在不同的情況下,對二者的要求也不同,有時 文獻的全面更為重要,這時就要以提高查全率為重點,有時希望找到的文獻準確率更高,就以提高查準率為重點。本文討論的是怎樣提高文獻的查全率。
1 檢索詞的轉換。常見的轉換是同義詞、近義詞、相關詞、單復數及縮寫形式,如果是動詞還有可能有不同的時態。每 一個檢索詞都有可能有多種表達形式,如果是由英文翻譯過來的還有可能有多種翻譯方法,所以應該盡可能找全檢索詞的所有同義詞、近義詞。相關詞指的是與檢索 詞不是同一個意思但是有關聯的詞。
如,META分析的同義詞包括元分析、薈萃分析、meta-analysis,近義詞包括系統綜述,相關詞為循證醫學。 前列腺癌的縮寫可能是Pca等等。值得注意的是,在檢索中文文獻的時候,有必要把英文的全稱和縮寫也作為檢索詞,因為有些中文文章中是直接用英文詞匯表示 的。
2 使用截詞符。雖然從理論上來說我們找到所有的同義詞和近義詞可以擴大檢索結果,但是要想做到這一點是相當困難的。這時可以利用截詞符來幫忙。一般用的截詞符是“?”和“*”,在不同的數據庫中表示的意思有所不同,常見的意思是“?”表示0-1個字符,而“*”表示多個字符。
3 使用上位詞,即指代范圍更廣的詞。有些檢索系統有主題詞途徑,則可以選用上位主題詞。例如水果是蘋果的上位詞,prostatic neoplasm的上位主題詞是prostatic disease。
4 改變布爾運算符,即將連接兩個或多個檢索詞的AND改為OR,即可提高檢出數量。
5 改變檢索項。如要求檢索詞位于標題中或為關鍵詞或主題,檢出記錄數太少,則可改為要求位于摘要或全文中,檢出記錄數即可增加。
6 減少限制條件,增加副主題詞。如果前面的檢索中有限制條件,放寬或去掉限制條件;如果采用的是主題詞和副主題詞搭配的形式,看是否漏掉可能的副主題詞。
以上說的是在同一個數據庫 中進行檢索。但是,每一個數據庫所收錄的文獻都是有限的,而不同的數據庫可能存在一定的互補關系。所以為了提高查全率,應該多檢索幾個數據庫,將結果綜合 起來。
當然前提條件是要了解每一個數據庫收錄期刊的范圍、起止年代等,因為不排除有些小的數據庫完全是另外一個大數據庫的子集的情況,這時當然完全沒有必 要再檢索那個小的數據庫了。
即使是將目前所有的數據庫 加起來,也不能囊括所有的文獻。例如,有一些年代比較久遠的,或者是期刊知名度不高的。
所以,除了在數據庫中進行檢索,還要輔以手工檢索。包括對一些重要 的而數據庫中沒有收錄的期刊進行手工檢索,在已經查到的文獻的“參考文獻”中或有些數據庫提供的“相關文獻”中進行查找,看有無“漏網之魚”,還有,可以 請教相關 領域的專家,看看是否有重要的文獻沒有檢索到。
一般我們檢索文獻不是英文的就是中文的,對于其它語種的則不做要求。如果是要求查全率很高,則可以檢索一些不常用的語種的文獻,如日文、法文、德文等等。當然如果自己不會那門語言,即使查到了,閱讀也是一個問題。如果真是非常重要,不妨請人翻譯過來。
PUBMED的查全率問題
PUBMED是最常用的醫 學網絡數據庫,它收錄的期刊范圍最廣,更新速度快,有部分(大約5%)能夠獲得免費的全文,95%以上有英文摘要,而且可以知道查到的某一篇文獻是收錄在 哪個全文數據庫中,因而深受醫學科研工作者歡迎。
PUBMED有自動轉換功能,在檢索框輸入一個檢索詞,它會自動將其轉化為對應的主題詞,同時進行主題詞 檢索和自由詞檢索,并把二者的檢索結果用“OR”連接起來。
所以,在PUBMED中,要提高查準率首選主題詞加副主題詞的形式,而要提高查全率則首選默認 的檢索形式,即打開PUBMED主頁后直接在檢索框輸入檢索詞。如果采用主題詞加副主題詞的形式,由于最新的部分文獻還沒有進行主題標引,因此不能檢索到 最新的文獻。
PUBMED的查全率問題 與上面所說的大同小異。值得注意的是,如果使用截詞符,其自動轉換功能即停止。可以采取的辦法是第一次用默認檢索,第二次用截詞符,再把兩次檢索的結果合 并起來。
例如,檢索詞的所有同義詞近義詞縮寫相關詞等分別為A、B、C、D、E,則第一次以默認的檢索方式檢索,檢索式為 A OR B OR C OR D OR E,第二次用截詞符檢索,如A? OR B* OR C? OR D OR E*, 再把兩次檢索的結果合并,檢索式為#1 OR #2。
此外,PUBMED還可以提供related articles, 點擊這里即可以看到與你檢索到的文獻相關的文獻,也許這其中就有需要而自己沒有查到的。
META分析的檢索問題
META分析是對文獻的查 全率要求最高的一種研究。嚴格的說,要求獲得“所有發表的和未發表的所有形式的信息”,也就是說,包括各國語言的期刊論文、會議論文、學位論文、書籍、 Cochrone圖書館的文獻及正在研究尚未發表的資料。
其實目前發表的META分析能夠達到這一要求的幾乎沒有,即使是發表在柳葉刀、BMJ這樣頂級醫 學期刊上的META分析也不例外。關于META分析的文獻檢索,以后如有時間我再詳細討論
本站僅提供存儲服務,所有內容均由用戶發布,如發現有害或侵權內容,請
點擊舉報。