首頁 > linux教程 > Linux文本處理(Linux三劍客) 閱讀:0更新時間:2020-03-28 00:57:08

Linux grep命令詳解:查找文件內容

很多時候,我們并不需要列出文件的全部內容,而是從文件中找到包含指定信息的那些行,要實現這個目的,可以使用 grep 命令。

grep 命令作為 linux 文本處理三劍客的一員,另外兩個是 sed 和 awk,它們會在后續章節中作詳細介紹。

grep 命令的由來可以追溯到 UNIX 誕生的早期,在 UNIX 系統中,搜索的模式(patterns)被稱為正則表達式(regular expressions),為了要徹底搜索一個文件,有的用戶在要搜索的字符串前加上前綴 global(全面的),一旦找到相匹配的內容,用戶就像將其輸出(print)到屏幕上,而將這一系列的操作整合到一起就是 global regular expressions print,而這也就是 grep 命令的全稱。

grep命令能夠在一個或多個文件中,搜索某一特定的字符模式(也就是正則表達式),此模式可以是單一的字符、字符串、單詞或句子。

正則表達式是描述一組字符串的一個模式,正則表達式的構成模仿了數學表達式,通過使用操作符將較小的表達式組合成一個新的表達式。正則表達式可以是一些純文本文字,也可以是用來產生模式的一些特殊字符。為了進一步定義一個搜索模式,grep 命令支持如表 1 所示的這幾種正則表達式的元字符(也就是通配符)。

表 1 正則表達式的通配符
通配符 功能
c* 將匹配 0 個(即空白)或多個字符 c(c 為任一字符)。
. 將匹配任何一個字符,且只能是一個字符。
[xyz] 匹配方括號中的任意一個字符。
[^xyz] 匹配除方括號中字符外的所有字符。
^ 鎖定行的開頭。
$ 鎖定行的結尾。
需要注意的是,在基本正則表達式中,如通配符 *、+、{、|、( 和 )等,已經失去了它們原本的含義,而若要恢復它們原本的含義,則要在之前添加反斜杠 \,如 \*、\+、\{、\|、\( 和 \)。

grep 命令是用來在每一個文件或中(或特定輸出上)搜索特定的模式,當使用 grep 時,包含指定字符模式的每一行內容,都會被打?。@示)到屏幕上,但是使用 grep 命令并不改變文件中的內容。

grep 命令的基本格式如下:

[root@localhost ~]# grep [選項] 模式 文件名

這里的模式,要么是字符(串),要么是正則表達式。而此命令常用的選項以及各自的含義如表 2 所示。

表 2 grep 命令常用選項及含義
選項 含義
-c 僅列出文件中包含模式的行數。
-i 忽略模式中的字母大小寫。
-l 列出帶有匹配行的文件名。
-n 在每一行的最前面列出行號。
-v 列出沒有匹配模式的行。
-w 把表達式當做一個完整的單字符來搜尋,忽略那些部分匹配的行。

注意,如果是搜索多個文件,grep 命令的搜索結果只顯示文件中發現匹配模式的文件名;而如果搜索單個文件,grep 命令的結果將顯示每一個包含匹配模式的行。

【例 1】假設有一份 emp.data 員工清單,現在要搜索此文件,找出職位為 CLERK 的所有員工,則執行命令如下:

[root@localhost ~]# grep CLERK emp.data
#忽略輸出內容

而在此基礎上,如果只想知道職位為 CLERK 的員工的人數,可以使用“-c”選項,執行命令如下:

[root@localhost ~]# grep -c CLERK emp.data
#忽略輸出內容


【例 2】搜索 emp.data 文件,使用正則表達式找出以 78 開頭的數據行,執行命令如下:

[root@localhost ~]# grep ^78 emp.data
#忽略輸出內容


grep 命令的功能非常強大,通過利用它的不同選項以及變化萬千的正則表達式,可以獲取任何我們所需要的信息。本節所介紹的 grep 命令,只介紹了它的一部分基礎知識,比如說,grep 命令可用的選項還有很多,且用法也五花八門,不過對于初學者來說,本節所介紹的內容已經足以應付多數 Linux 系統的日常工作了。

beylze編程學院,一個分享編程知識和seo優化知識的網站。跟著beylze一起學習,每天都有進步。

通俗易懂,深入淺出,一篇文章只講一個知識點。

文章不深奧,不需要鉆研,在公交、在地鐵、在廁所都可以閱讀,隨時隨地漲姿勢。

文章不涉及代碼,不燒腦細胞,人人都可以學習。

當你決定關注beylze(公眾號:beylze),你已然超越了90%的其他從業者!

相關文章

優秀教程

国产亚洲欧美日韩