<dd id="fdj3f"></dd>
      <button id="fdj3f"></button>

    1. <li id="fdj3f"><acronym id="fdj3f"><u id="fdj3f"></u></acronym></li>

      <progress id="fdj3f"></progress><li id="fdj3f"><acronym id="fdj3f"><u id="fdj3f"></u></acronym></li>
      <th id="fdj3f"><pre id="fdj3f"></pre></th>

    2. <rp id="fdj3f"><acronym id="fdj3f"></acronym></rp>
      <button id="fdj3f"><acronym id="fdj3f"></acronym></button>
          <th id="fdj3f"></th>

          蛋白質組學

          北京青蓮百奧生物科技有限公司

          領跑智慧多組學,助力科研新發現


          服務咨詢熱線

          010-53395839

          蛋白質組學,糖基化蛋白質組學,多組學聯合分析
          您當前的位置 : 首 頁 > 新聞動態 > 行業資訊

          「青蓮干貨」不會做編程怎么做生信分析(二)

          2021-07-14 00:00:00

          bef1f919bfe9fa877aa51ddbc40a403.png

          b6a874b61bbffd1d00d19c40c069cc1.png

          上期我們介紹了Excel的數據處理,想必以前沒接觸過的人學習后數據處理能力會有明顯的提高。俗話說,能力越強,自由度越大。隨著數據處理能力的增強,需要處理的數據也越來越雜,很快我們就會發現,僅僅依靠Excel是不夠用的。在此,給大家隆重推薦數據處理高手常用的兩個簡單高效的神器:文本處理軟件Notepad++,以及windows中的dos命令操作(linux系統中一般叫shell命令)。




          文本處理軟件




          文本處理軟件,就是處理txt格式的軟件。windows系統自帶了一個文本編輯器,但只有非?;A的功能,用起來很不方便。在此,小編推薦一款名為Notepad++的軟件,它憑借著其輕量,好用,免費的特點深受廣大科研人員的喜愛。

          Notapad++安裝過程





          安裝過程很簡單可以從官網https://notepad-plus-plus.org/downloads/v7.8.8/下載,安裝選項默認即可。安裝完成后,文本文件就可以通過右鍵->打開方式->Notepad++打開。


          Notapad++基本操作介紹





          (1)顯示所有字符
          你還在經常因為分不清文檔中的間隔符號是空格還是Tab鍵而煩惱嗎?Notepad++開啟顯示所有字符后,輕松分辨各個符號。如圖所示,箭頭符號表示Tab鍵,中間小點表示空格,末尾的黑色CRLF表示回車換行符。

          設置方式:視圖 -> 顯示符號 -> 顯示所有字符

          微信圖片_20210714133125.png


          (2)選中字符長度計數

          Notepad++具有方便的字符計數功能。

          微信圖片_20210714133135.png

          1,文檔中總字符個數。
          2,文件有幾行。
          3,光標位置,光標的橫縱坐標。
          4,兩側的數字分別表示的是選中的字符長度和所占行數。

          備注:windows下的回車換行符(CRLF)占用2個字符長度。


          利用正則表達式查找替換





          下面我們重點介紹一下最常用的查找和替換功能,Notepad++支持正則表達式,使查找替換更方便。什么你不知道什么是正則表達式?正則表達式描述了一種字符串匹配的模式,可以用來檢查一個字符串是否含有某種子串、將匹配的子串替換或者從某個字符串中取出符合某個條件的子串等。

          1)常用的正則表達式

          e7f6e2dc8b77f4afed87bb652d58656.png

          2)應用實例

          下面我們就用正則表達式為您介紹如何在fasta文件中尋找某個已知序列?
          為了方便觀察,fasta文件一般每行有80個氨基酸/核苷酸,這會導致我們在檢索時發生斷點,導致檢索不到,所以我們要先整理一下格式,把每個序列分別合成一行。

          在這之前,我們先學習一下,如何打開查找替換窗口。按快捷鍵“Ctrl + H”或者鼠標點擊上方工具欄中的“搜索-替換”調出替換窗口。查找模式選擇“正則表達式”,在“查找目標”和“替換為”處填入相關內容,最后點擊全部替換,即可完成替換。


          把序列變成一行有很多種方法,小編的辦法是先在包含”>”的行兩側添加標記,再把所有的換行符替換成空白,最后再把之前的標記替換成換行符。大家也可以發揮一下想象力,想想有沒有更好的方法。

          第一次替換為:“(?<name>^>.*)”替換為“##$+{name}##”,其中“^>”表示行開頭是“>”,“.*”表示任意字符至少0個,加起來“^>.*”表示的就是包含“>”的行了,“(?<name>^>.*)”表示的是把括號內匹配到的內容寫入到變量“?<name>”里?!?#$+{name}##”表示的意思是把剛才匹配到的內容$+{name}的兩邊添加一個標記,這里標記我用了2個#號。
          第二次替換為:“\n”替換為“”空。

          第三次替換為:“##”替換為“\n”

          初次使用正則表達式,大家可能不太習慣,可以多看兩次消化消化。
          注意:顯示所有符號時,末尾的[CRLF]用\r\n表示。[LF]用\n表示。還有需要注意的是正則表達式里所有的符號均為英文符號。

          好了準備工作終于做完了,下面我們就來匹配肽段吧。

          按快捷鍵“Ctrl + F”或者鼠標點擊上方工具欄中的“搜索-查找”調出搜索窗口。在“查找目標:”中輸入我們的肽段,點擊計數,會在搜索框的的下方顯示匹配到了多少個;點擊查找下一個,光標會移動到下一個匹配項。當然也可以選擇使用標記功能,Notepad++會把所有匹配到的內容用顏色標記出來。

          那么如果我們只想要肽段出現在序列的開頭或末尾呢?“^肽段”只會匹配到開頭包含該肽段的序列;“肽段$”只會匹配到末尾包含該肽段的序列。注意,查找模式記得選擇正則表達式哦。

          文件內的操作,我們可以很方便的用Notepad++完成,那么文件外的操作呢?文件的移動,復制又該如何高效完成呢?該輪到dos批處理出場了。



          DOS命令操作




          DOS命令是早期計算機操作系統使用的,為了用戶使用方便才逐漸發展出了windows視窗界面。雖然視窗界面用戶體驗要好得多,但DOS命令由于其獨特的優勢依然被保留下來,成為數據處理常用的利器。

          DOS是一種面向磁盤的系統軟件,有了DOS,我們就可以更容易理解怎么給機器下命令,只需通過一些接近于英語的DOS命令,我們就可以輕松地完成絕大多數的日常操作,提高效率。


          什么是DOS命令





          DOS是Disk Operating System的縮寫,即磁盤操作系統。它是一個基于磁盤管理的操作系統,在微軟公司的Windows2000出版之前,DOS 系統基本統治著個人操作系統世界。別看現在Windows圖形界面風光無限,但是還是有很多的很難解決或者無法解決的問題,而這個時候我們的DOS系統就可以大顯身手了,用DOS命令來解決一些問題,往往會收到事半功倍的效果。
          批處理是一種簡化的腳本語言。它是由Windows系統內嵌的命令解釋器CMD)解釋運行。類似于Unix中的Shell腳本。批處理文件具有.bat擴展名,其最簡單的例子,是逐行書寫在命令行中會用到的各種命令。更復雜的情況,需要使用if,for,goto等命令控制程序的運行過程,如同C,Python,R計算機語言一樣。簡單說就是可以把dos命令寫入到bat腳本里,雙擊運行bat腳本就可以把所有的dos命令批量運行。


          如何打開CMD窗口





          方式一:快捷鍵“windows徽標鍵 + R”彈出運行窗口,輸出cmd回車,即可打開。
          方式二:在開始菜單的搜索欄,輸入cmd或者命令提示符,點擊打開。


          基本命令





          (1)路徑操作

          cd ..——返回上一級目錄

          cd 待跳轉的路徑名稱——打開該路徑

          E:——打開E盤(切換磁盤,直接輸入盤符和冒號)

          dir——查看當前路徑下有哪些文件

          微信圖片_20210714133411.png


          (2)文件新建,刪除,移動,復制,重命名

          md 文件夾名稱——新建文件夾

          del 文件(夾)名稱——刪除文件(夾)

          copy 文件(夾)路徑——新文件(夾)路徑復制文件(夾)

          move 文件(夾)路徑——新文件(夾)路徑移動文件(夾)

          ren 文件(夾)名稱——新文件(夾)名稱重命名文件(夾)

          微信圖片_20210714133415.png


          簡單實例:批量改文件名





          批量重復的改文件名是很繁瑣枯燥的,尤其是只更改文件中的某些字符,這時候dos命令的優越性就體現出來了??菰锏墓ぷ骶徒唤o計算機自己干吧。

          (1)利用通配符批量改文件名

          通配符是一種特殊語句,主要有星號(*)和問號(?),用來模糊搜索文件?!?”可以代表任意單個字符,輸入幾個“?”就代表幾個未知字符;“*”可以代表任意多個字符。
          現在我有若干文件,分別叫做“a1.jpg”,“a2.jpg,“a3.jpg”等等。如果我想把前綴的字母a改為b該怎么辦呢?

          微信圖片_20210714133418.png

          對,只要在該文件路徑下,輸入“ren a* b*”這串命令就可以了,是不是很簡單。我們來解釋一下這串命令:ren命令是dos中重命名的命令;a*會匹配到當前文件夾下的所有已a開頭的文件,“*”代表任意多個字符;b*表示新名稱。該命令會把所有匹配到的文件的前綴字母a變為b。

          (2)利用bat批處理文件更改文件名

          有時候我們重命名可能不會像之前那么有規律,如果我們想完全自定義可以采用dos批處理的方式。

          首先我們打開待更改的文件夾,點擊“全部選擇”,接著點擊“復制路徑”,我們就成功的把所有文件的路徑名稱復制到了剪貼板。

          微信圖片_20210714133507.png

          接著,我們在當前文件夾下,新建一個txt文件,并把后綴改為“.bat”,然后右鍵該文件,選擇打開方式,用Notepad++打開。

          然后我們把剛才復制的內容粘貼到編Notepad++里。Notepad++的列操作是按住“alt”鍵和鼠標結合選中的方式,我們用列操作的方式,選中行開頭,輸入“ren ”,接著在每行的末尾輸入空格+新名稱。最后不要忘記保存哦。


          微信圖片_20210714133510.png
          好了,見證奇跡的時候到了,我們雙擊剛才新建的bat文件,重命名就完成了。同理,文件的移動,復制大體過程也跟此類似,dos命令的強大之處還有很多,剩下的還要靠自己探索啦。
          至此,我們學習了Notepad++和dos的基本操作,并用他們完成了正則表達式匹配肽段,dos命令批量重命名文件。當然,我們只是演示了一些最基礎的處理方式,如果需要更復雜的方法,還需要發掘Notepad++和dos的其它功能,或者采用其它工具輔助的方法實現。



          想必有人會覺得Notepad++和dos學起來有點麻煩,寧可不用也不學。但以我們的經驗來看,這兩個工具入門可能有點費勁,但用熟悉后,融會貫通,你會發現數據處理竟如此簡單。

          圖片

          青蓮百奧可提供一站式蛋白質組學、代謝組學、轉錄組學、多組學聯合分析等科研服務。青蓮百奧在質譜檢測方面項目經驗豐富,擁有國際一流的質譜平臺,海歸坐鎮專業生信分析團隊,助您在科研道路上乘風破浪,沖擊高水平文章。更多技術服務敬請來電咨詢:010-53395839。


          最近瀏覽:

          相關產品

          相關新聞

          北京青蓮百奧生物科技有限公司

          固話:010-53395839
          郵箱:service@qinglianbio.com
          地址:北京市海淀區永豐產業基地綠海大廈C座301


          掃一掃,關注我們
          视频一区 国产精品 大秀视频_手机看片一级_中文无码久久精品_高清无码视频直接看