분류 전체보기
barcode
barcode
분류 전체보기
잡담
단문
장문
그림있음
Coding
코딩잡담
JavaScript
Python
R
BOJ
[BOJ] Python
잔머리 엑셀
Guestbook
Tags
RSS
------------------------
Biopython으로 Entrez database 탐방하기
Coding/Python
barcode
Biopython으로 Entrez database 탐방하기
Coding/Python
이것이 그... BLAST 만든 NCBI에 있는 데이터베이스다. 미국답게 스케일 개크다. 들어가기 전에 보통 Biopython을 쓰거나 랜덤, 넘파이, 판다스를 쓸 때는 뭘 모셔와야 하는데, Entrez에 접속하는 모듈도 마찬가지다. 근데 바이오파이썬은 그걸 떠나서 모셔오는 게 너무 핵가족 스케일이여. 아무튼... 그래서 이번에는 from Bio import Entrez 이걸 필두로 뭘 많이 모셔올 예정인데... 아니 아직 아냐 마저 듣고 가. Entrez에 접속해서 뭘 하려면 저거 말고 필수적으로 입력해야 하는 게 있다. 1. 너님의 API 키 2. 너님의 메일 주소 3. 너님의 매개 변수 셋 중 하나는 반드시 입력해야 하고, 여기서는 이메일을 입력할건데 저거 뭐 이메일 제출한다고 CIA에서 당신 털러..
Biopython으로 BLAST 돌려보기
Coding/Python
barcode
Biopython으로 BLAST 돌려보기
Coding/Python
쿡북에 있는 것 중 일부 생략했다. (BLAT이랑 8.3~8.5부분) BLAST는 Basic local alignment search tool의 준말로, 보통 블래스트라고 한다. 지나가는 2~30대를 붙잡고 크흐~대 기억이~ 하면 지~난 사랑이~ 가 나오듯, 지나가던 생물학도를 붙잡고 블래스트? 하면 NCBI! 하는 정도로 국민 툴이고 전공수업을 듣다 보면 한 번은 쓰고 넘어가는 툴이기도 하다. 애초에 전공이 생물학인지를 먼저 물어봐야 하는 거 아니냐 이 글에 있는 게 어렵다… 그러면 조용히 구글을 열고 BLAST 검색해서 웹사이트 들어가자. 거기서 할 수 있다. NCBIWWW www가 우리말로 ㅋㅋㅋ이긴 한데 그건 일본에서 통하는 말이고... 보통은 월드 와이드 웹이다. BLAST를 따로 깔지 않고도 ..
번외편-코딩테스트 풀이
Coding/Python
barcode
번외편-코딩테스트 풀이
Coding/Python
코테 본다는 얘기는 못 들은 것 같고... 그냥 면접보다가 어디 실력 좀 볼까? 해서 나온거긴 한데... IDE도 셋업 안 된 상태에서 jupyter 데모로 봤었음... 근데 Python을 안 쓰면 나한테 연락을 안 할것인데 이건 뭔 상황인지 모르겠고... 거기다가 실습할 때 썼던 파일들 올릴랬는데 깃헙 뻑나서 오전중에는 그거랑 씨름함... 해결은 봤죠. 참고로 어제 사용한 FASTAQ파일과 오늘 사용한 FASTAQ파일은 다릅니다. 이거 구하기도 개빡셈. 모듈 모셔오기 from Bio import SeqIO from Bio.Seq import Seq from Bio.SeqRecord import SeqRecord import numpy as np import pandas as pd 세번째줄 안불러도 됨 ..
R 배워보기- 6.5. Manipulating data-Sequential data
Coding/R
barcode
R 배워보기- 6.5. Manipulating data-Sequential data
Coding/R
내일 예고: 통계분석 들어가기 때문에 골치아파질 예정 교수님 죄송합니다 여러번 외칠 예정 이동평균 계산하기 이동평균: 전체 데이터 집합의 여러 하위 집합에 대한 일련의 평균을 만들어 데이터 요소를 분석하는 계산(솔직히 뭐 하는건지는 모르겠음) 난 sequential data라길래 파이썬처럼 시퀀스형 데이터가 있나 했더니 연속형 데이터 말하는건가봄. 전구간에서 미분 가능한가요 NA 들어가면 짤없을 예정 > set.seed(1) > x=1:300 > y=sin(x)+rnorm(300,sd=1) > y[295:300]=NA > plot(x, y, type="l", col=grey(.5)) 일단 뒤에 여백의 미를 줄 예정이다. (마른세수) > grid() 이게 모눈을 킨다고 다 이쁜 그래프가 아니그등요... 아..
R 배워보기- 6.4. Manipulating data-Restructing data
Coding/R
barcode
R 배워보기- 6.4. Manipulating data-Restructing data
Coding/R
들어가기 전에 아니 새기들아 깔아야 하는 라이브러리가 있으면 미리 좀 알려달라고!!! (깊은 분노) 아니 어느 레시피에서 재료설명도 없이 주저리 주저리 레시피 쓰다가 존내 당연하다는 듯 여러분 다들 집에 맨드레이크 있으시죠? 맨드레이크를 채썰어주세요. 하면서 레시피를 쓰냐!!! 집에 왜 그런게 있죠 아니 외가에서 무 받아온게 사람 모양이더라고 아무튼... 좀 개빡치긴 했지만... 라이브러리 깔고 가세요... install.packages("tidyr") install.packages("reshape2") install.packages("doBy") 테이블 가로세로 바꾸기 테이블은 보통 가로로 길거나 세로로 길거나 둘 중 하나이다. 캡처는 못했지만, 전전직장에서 일하면서 SQL로 정리해뒀던 샘플 표는 가로..
R 배워보기- 6.3. Manipulating data-Data Frames
Coding/R
barcode
R 배워보기- 6.3. Manipulating data-Data Frames
Coding/R
들어가기 전에 작은 시범조교를 하나(아니고 넷) 준비했음.. 다운 ㄱㄱ 각 csv파일의 내용물을 R로 불러오면 > df=read.csv('/home/koreanraichu/example.csv',sep=";") > df ID Interesred.in Class 1 kimlab0213 Python Basic 2 ahn_0526 Python Medium 3 peponi01 R Basic 4 kuda_koma R Expert 5 comma_life Java Basic 6 wheresjohn Java Medium 7 hanguk_joa Python Expert 8 sigma_00 R Basic 9 kokoatalk Java Basic (example, 구분자 세미콜론) > df2=read.csv('/home/k..
R 배워보기- 6.2. Manipulating data-Factors
Coding/R
barcode
R 배워보기- 6.2. Manipulating data-Factors
Coding/R
R의 데이터에는 벡터와 팩터가 있다. 그리고 숫자벡터-문자벡터-팩터간에 변환이 가능하다. 어쨌든 가능함. 팩터란 무엇인가 뮤츠씨가 좋아하는거 그건 팩트고 아무튼 벡터와 달리 팩터를 단식으로 뽑게 되면 한 가지 요소가 더 나오게 된다. 그것이 바로 '레벨'이다. > v=factor(c("A","B","C","D","E","F")) > v [1] A B C D E F Levels: A B C D E F > w=factor(c("35S Promoter","pHellsgate","pStargate","pWatergate","pHellsgate")) > w [1] 35S Promoter pHellsgate pStargate pWatergate pHellsgate Levels: 35S Promoter pHellsg..
R 배워보기- 6.1. Manipulating data-General
Coding/R
barcode
R 배워보기- 6.1. Manipulating data-General
Coding/R
이거 쿡복 보니까 시리즈가 개 많고... 분량이 그냥 종류별로 있습니다... 농담같지만 실화임. 그래서 세부적으로 나갈거예요... 근데 데이터프레임에 csv 불러오는 건 생각 좀 해봐야겠음. 분량이 정말 살인적입니다. 농담 아님. 아 참고로 데이터프레임 정리하기에 라이브러리가 하나 필요합니다. plyr이라고... 그거 없이 하는 방법도 있긴 한데 나중에 뭉텅이로 처리하려면 plyr 필요해요. install.packages("plyr") 설치 ㄱㄱ. sort() 벡터는 sort()로 정렬한다. 그죠 여기 벡터가 나온다는 건 데이터프레임도 있다 이겁니다. (스포일러) > v=sample(1:25) > v [1] 11 2 12 18 23 21 22 14 3 19 13 9 1 16 5 20 6 10 25 8 4..
Biopython으로 MSA 해보기
Coding/Python
barcode
Biopython으로 MSA 해보기
Coding/Python
MSA: multiple sequence alignment 여기에 관한 이론적인 설명은 나중에 또 입 털어드림 ㅇㅇ 아 참고로 MSA 관련해서 다른건 다 결과가 제대로 나왔는데 툴 관련해서 결과가 안나왔어요 이게 암만 찾아도 답이 없어서 좀 더 알아보고 수정할 가능성이 있음 시범조교 앞으로 오늘은 시범조교 가짓수가 좀 많은데 그 중에서도 FASTA 파일들을 좀 올리고자 한다. 이거 말고도 pfam에서 두갠가 받았는데 그건 걍 가서 암거나 받으면 된다. 해당 파일은 박테리아의 16s rRNA 시퀀스가 들어있는 파일이다. FASTA 파일이라 메모장 있으면 일단 열 수는 있다. 리눅스에서는 gedit으로 만들고 편집하고 다 했다. (vim 안씀) rRNA 시퀀스는 Silva에서 가져왔다. 고마워요 실바! Ag..
Biopython SeqIO 써보기
Coding/Python
barcode
Biopython SeqIO 써보기
Coding/Python
파이참 쓰다보니 키보드 먹통돼서 재부팅 여러번 했다. 이것도 갈 때 된 듯... *참고로 그냥 리드나 파싱으로 긁어오는 방법은 첫 글에서 썼으므로 생략한다. Iteration 활용하기 근데 들어도 이건 뭔 기능인가 싶긴 함. from Bio import SeqIO identifiers = [seq_record.id for seq_record in SeqIO.parse("/home/koreanraichu/sequence.gb", "genbank")] print(identifiers) 뭐야 wrap 넣어줘요... 레코드와 for문을 조합해서 원하는 데이터(ID나 시퀀스, description)만 가져올 수 있다. from Bio import SeqIO identifiers = [seq_record.id fo..
Biopython으로 시퀀스 레코드 생성하고 만져보기
Coding/Python
barcode
Biopython으로 시퀀스 레코드 생성하고 만져보기
Coding/Python
오늘껀 근데 하면서 나도 이해 못했음... SeqRecord를 만들려면 뭘 또 모셔와야 하는데 바로 from Bio.SeqRecord import SeqRecord 이놈이다. 이정도면 복잡한 거 돌리려면 아주 모셔오는데만 열댓줄 쓰게 생겼는데??? 텐서플로우나 저기 그 넘파이 판다스처럼 합쳐버리지 그러냐... (걔네는 일단 한 번 데려오면 다 써먹을 수 있음) 레코드 생성하기 이모지 넣고싶은데 이거 리눅스라 이모지 넣는 법을 모름... 아무튼 레코드는 이렇게 생성하면 된다. from Bio.SeqRecord import SeqRecord from Bio.Seq import Seq EcoRI=Seq("GAATTC") # ECoRI sequence ECoRI_r=SeqRecord(EcoRI) #로 레코드를 ..
Biopython으로 시퀀스 다뤄보기
Coding/Python
barcode
Biopython으로 시퀀스 다뤄보기
Coding/Python
전에요? 아니 그건 가져온거고. 시퀀스도 텍스트나 리스트처럼 인덱싱과 슬라이싱이 된다. 방법도 똑같다. 그래서 그건 생략할 예정임... 그리고 그거 아니어도 분량이 많아요 또. .count() 특정 문자열이 몇 개인지 세 준다. 뭐 시퀀스에서 아데닌이나 구아닌 갯수 세주고 그런거다. 이걸 이용하면 특정 단백질 시퀀스에서 특정 아미노산(카테고리면 겁나 세야된다...)이 차지하는 비율도 볼 수 있다. 쉬어가는 코너-Primer에서 GC함량 구하기 아 이거 중요합니다. Primer 만들 때 중요한 요소 중 하나가 GC 함량이다. 참고로 여기서는 두 가지 방법으로 구해볼건데 첫번째는 .count()를 이용해 G와 C의 수를 세서 전체 DNA 염기 수로 나누는 거고, 두번째는 바이오파이썬의 모듈을 이용하는 방법이..
<
1
···
26
27
28
29
30
31
32
···
36
>
https://koreanraichu.tistory.com/
티스토리툴바