인생은 언제나 Try and Except
close
프로필 배경
프로필 로고

인생은 언제나 Try and Except

  • 분류 전체보기 (669) N
    • 잡담 (307) N
      • 단문 (106) N
      • 장문 (32) N
      • 그림있음 (126) N
      • 나야, 언박싱 (42)
    • Coding (178) N
      • 코딩잡담 (22)
      • JavaScript (55) N
      • Python (81)
      • R (20)
    • BOJ (116)
      • [BOJ] Python (116)
    • 잔머리 엑셀 (67) N
  • 홈
  • 태그
  • 방명록
Biopython으로 Clusting analysis 하기 (실전편)

Biopython으로 Clusting analysis 하기 (실전편)

와! 드디어 실전인가요? 근데 실전 생각보다 노잼임... Distance matrix 거리 행렬. 두 점간의 거리를 배열해 행렬로 나타낸 것이다. 점이 N개일 때 Distance matrix는 N*N으로 표기할 수 있다. import numpy as np import pandas as pd from Bio.Cluster import distancematrix data=np.array([[0, 1, 2, 3],[4, 5, 6, 7],[8, 9, 10, 11],[1, 2, 3, 4]]) matrix = distancematrix(data) # 뭐야 이거 왜 한영키 안먹어요 distances = distancematrix(data, dist='e') print(distances) [array([], dtype..

  • format_list_bulleted Coding/Python
  • · 2022. 8. 21.
  • textsms
Biopython으로 Clusting analysis 하기 (이론편)

Biopython으로 Clusting analysis 하기 (이론편)

분량도 분량인데 spyder에서 한영키가 안돼서 그거땜시 늦었음... 이게 한 글에 다 쓰기엔 좀 분량도 분량인데 이게 생각보다 설명이랑 코딩이랑 나뉘어있어서 이론편 실전편 나눕니다. 이건 clustering 중 하나인 hierarchical clusting. 오늘 할 게 대충 이런거다. Cluster? 비슷한 특성을 가진 데이터 집단을 클러스터라고 한다. 데이터의 특성이 비슷하면 같은 클러스터, 다르면 다른 클러스터에 속한다. 클러스터링 하는 방법이 여러개가 있는데 여기서는 k-mean, k-median, k-medoid랑 hierarchical clustering에 대해 그냥 개 간단하게 설명하고 넘어간다. Hierarchical clustering 앞에 k-들어가는 것과 달리 계층적 클러스터링이라고..

  • format_list_bulleted Coding/Python
  • · 2022. 8. 21.
  • textsms
Biopython으로 Sequence motif analysis 하기

Biopython으로 Sequence motif analysis 하기

모티브 찾으면 구조 모티브가 나오는데 이거는 '단백질이나 핵산과 같은 사슬 모양의 생체 분자에서 진화적으로 관련이 없는 다양한 분자에서 나타나는 일반적인 3차원 구조'로 정의한다. 근데 여기서 다루는 모티브는 그거 말고 시퀀스 모티브... 대충 이런거다. 위 그림은 뭔 시퀀스인지는 모르겠으나 3, 4, 5번째 염기가 GAA가 압도적으로 많은 듯. 오늘은 대충 from Bio import motifs 이런거 부른다. Motif object 객체 생성하기 from Bio import motifs from Bio.Seq import Seq instances=[Seq("TGTCGTATCG"),Seq("GTAAATAGCC"),Seq("GTAAATAACC"),Seq("TCGCGGAGCC"),Seq("ATGTGCCA..

  • format_list_bulleted Coding/Python
  • · 2022. 8. 21.
  • textsms
Biopython으로 Phylogenetic tree 그리기

Biopython으로 Phylogenetic tree 그리기

걍 메가 쓰세여... 메가가 편해... 짱이야 메가... 계통수? 계통수... 그러니까 Phylogenetic tree는 이런거다. (...) 유전자나 단백질 시퀀스 분석(균이라면 16s rRNA라던가)을 통해 얘네가 얼마나 가까운지를 알아내게 되면 그걸 저런 식으로 그려서 나타내는 것. 저렇게 생물 종에 따라 그리는 경우도 있고, 특정 단백질의 homolog나 다른 생물종에서 같은 역할을 하는 단백질에 대해서 저걸 그리기도 한다. 와! 계통수! 그려보자! from Bio import Phylo tree = Phylo.read("/home/koreanraichu/Deinococcus.ph", "newick") 이걸 쓰면 그릴 수 있는데... 어디가 일로와 끝까지 듣고 가... 저것만 쓰면 그려는 주는데 ..

  • format_list_bulleted Coding/Python
  • · 2022. 8. 21.
  • textsms
Biopython으로 PDB 탐방하기

Biopython으로 PDB 탐방하기

PDB!! PDB!! 들어가기 전에 PDB는 protein data bank의 약어이기도 하고, 거기서 제공하는 파일 형식이기도 하다. 여기서는 그냥 PDB라고 하면 데이터뱅크, PDB '파일'이라고 하면 PDB 파일이다. 그리고 이새기들 쿡북쓰기 귀찮았는지 모듈 불러와야 하는 거 빼먹더라... 니들도 일하기 싫었구나 파일 읽기 쓰기도 있긴 한데 그건 생략. 읽는것도 하난가 두갠가 오류나서 안됐다. 이 섹션에서 읽을 파일은 1) mmCIF 2) MMTF 3) PDB파일 4) PQR 이다. mmCIF from Bio.PDB.MMCIFParser import MMCIFParser parser = MMCIFParser() structure = parser.get_structure("7f0l", "/home/k..

  • format_list_bulleted Coding/Python
  • · 2022. 8. 21.
  • textsms
Biopython으로 Swiss-prot과 ExPASy 데이터베이스 탐방하기

Biopython으로 Swiss-prot과 ExPASy 데이터베이스 탐방하기

근데 스위스프롯은 긁어와서 저장 안됨? 첫빠따는 파싱이 국룰이지 파싱 방법이 네 가지가 있는데 gZIP은 생략. gZIP 파일을 못 구했다. handle=open('/home/koreanraichu/Q63HQ2.txt') print(handle) import gzip handle = gzip.open("myswissprotfile.dat.gz", "rt") from urllib.request import urlopen url = "https://raw.githubusercontent.com/biopython/biopython/master/Tests/SwissProt/F2CXE6.txt" handle = urlopen(url) print(handle) from Bio import ExPASy handle ..

  • format_list_bulleted Coding/Python
  • · 2022. 8. 21.
  • textsms
Biopython으로 Entrez database 탐방하기

Biopython으로 Entrez database 탐방하기

이것이 그... BLAST 만든 NCBI에 있는 데이터베이스다. 미국답게 스케일 개크다. 들어가기 전에 보통 Biopython을 쓰거나 랜덤, 넘파이, 판다스를 쓸 때는 뭘 모셔와야 하는데, Entrez에 접속하는 모듈도 마찬가지다. 근데 바이오파이썬은 그걸 떠나서 모셔오는 게 너무 핵가족 스케일이여. 아무튼... 그래서 이번에는 from Bio import Entrez 이걸 필두로 뭘 많이 모셔올 예정인데... 아니 아직 아냐 마저 듣고 가. Entrez에 접속해서 뭘 하려면 저거 말고 필수적으로 입력해야 하는 게 있다. 1. 너님의 API 키 2. 너님의 메일 주소 3. 너님의 매개 변수 셋 중 하나는 반드시 입력해야 하고, 여기서는 이메일을 입력할건데 저거 뭐 이메일 제출한다고 CIA에서 당신 털러..

  • format_list_bulleted Coding/Python
  • · 2022. 8. 21.
  • textsms
Biopython으로 BLAST 돌려보기

Biopython으로 BLAST 돌려보기

쿡북에 있는 것 중 일부 생략했다. (BLAT이랑 8.3~8.5부분) BLAST는 Basic local alignment search tool의 준말로, 보통 블래스트라고 한다. 지나가는 2~30대를 붙잡고 크흐~대 기억이~ 하면 지~난 사랑이~ 가 나오듯, 지나가던 생물학도를 붙잡고 블래스트? 하면 NCBI! 하는 정도로 국민 툴이고 전공수업을 듣다 보면 한 번은 쓰고 넘어가는 툴이기도 하다. 애초에 전공이 생물학인지를 먼저 물어봐야 하는 거 아니냐 이 글에 있는 게 어렵다… 그러면 조용히 구글을 열고 BLAST 검색해서 웹사이트 들어가자. 거기서 할 수 있다. NCBIWWW www가 우리말로 ㅋㅋㅋ이긴 한데 그건 일본에서 통하는 말이고... 보통은 월드 와이드 웹이다. BLAST를 따로 깔지 않고도 ..

  • format_list_bulleted Coding/Python
  • · 2022. 8. 20.
  • textsms
번외편-코딩테스트 풀이

번외편-코딩테스트 풀이

코테 본다는 얘기는 못 들은 것 같고... 그냥 면접보다가 어디 실력 좀 볼까? 해서 나온거긴 한데... IDE도 셋업 안 된 상태에서 jupyter 데모로 봤었음... 근데 Python을 안 쓰면 나한테 연락을 안 할것인데 이건 뭔 상황인지 모르겠고... 거기다가 실습할 때 썼던 파일들 올릴랬는데 깃헙 뻑나서 오전중에는 그거랑 씨름함... 해결은 봤죠. 참고로 어제 사용한 FASTAQ파일과 오늘 사용한 FASTAQ파일은 다릅니다. 이거 구하기도 개빡셈. 모듈 모셔오기 from Bio import SeqIO from Bio.Seq import Seq from Bio.SeqRecord import SeqRecord import numpy as np import pandas as pd 세번째줄 안불러도 됨 ..

  • format_list_bulleted Coding/Python
  • · 2022. 8. 20.
  • textsms
R 배워보기- 6.5. Manipulating data-Sequential data

R 배워보기- 6.5. Manipulating data-Sequential data

내일 예고: 통계분석 들어가기 때문에 골치아파질 예정 교수님 죄송합니다 여러번 외칠 예정 이동평균 계산하기 이동평균: 전체 데이터 집합의 여러 하위 집합에 대한 일련의 평균을 만들어 데이터 요소를 분석하는 계산(솔직히 뭐 하는건지는 모르겠음) 난 sequential data라길래 파이썬처럼 시퀀스형 데이터가 있나 했더니 연속형 데이터 말하는건가봄. 전구간에서 미분 가능한가요 NA 들어가면 짤없을 예정 > set.seed(1) > x=1:300 > y=sin(x)+rnorm(300,sd=1) > y[295:300]=NA > plot(x, y, type="l", col=grey(.5)) 일단 뒤에 여백의 미를 줄 예정이다. (마른세수) > grid() 이게 모눈을 킨다고 다 이쁜 그래프가 아니그등요... 아..

  • format_list_bulleted Coding/R
  • · 2022. 8. 20.
  • textsms

R 배워보기- 6.4. Manipulating data-Restructing data

들어가기 전에 아니 새기들아 깔아야 하는 라이브러리가 있으면 미리 좀 알려달라고!!! (깊은 분노) 아니 어느 레시피에서 재료설명도 없이 주저리 주저리 레시피 쓰다가 존내 당연하다는 듯 여러분 다들 집에 맨드레이크 있으시죠? 맨드레이크를 채썰어주세요. 하면서 레시피를 쓰냐!!! 집에 왜 그런게 있죠 아니 외가에서 무 받아온게 사람 모양이더라고 아무튼... 좀 개빡치긴 했지만... 라이브러리 깔고 가세요... install.packages("tidyr") install.packages("reshape2") install.packages("doBy") 테이블 가로세로 바꾸기 테이블은 보통 가로로 길거나 세로로 길거나 둘 중 하나이다. 캡처는 못했지만, 전전직장에서 일하면서 SQL로 정리해뒀던 샘플 표는 가로..

  • format_list_bulleted Coding/R
  • · 2022. 8. 20.
  • textsms

R 배워보기- 6.3. Manipulating data-Data Frames

들어가기 전에 작은 시범조교를 하나(아니고 넷) 준비했음.. 다운 ㄱㄱ 각 csv파일의 내용물을 R로 불러오면 > df=read.csv('/home/koreanraichu/example.csv',sep=";") > df ID Interesred.in Class 1 kimlab0213 Python Basic 2 ahn_0526 Python Medium 3 peponi01 R Basic 4 kuda_koma R Expert 5 comma_life Java Basic 6 wheresjohn Java Medium 7 hanguk_joa Python Expert 8 sigma_00 R Basic 9 kokoatalk Java Basic (example, 구분자 세미콜론) > df2=read.csv('/home/k..

  • format_list_bulleted Coding/R
  • · 2022. 8. 20.
  • textsms
  • navigate_before
  • 1
  • ···
  • 46
  • 47
  • 48
  • 49
  • 50
  • 51
  • 52
  • ···
  • 56
  • navigate_next
공지사항
전체 카테고리
  • 분류 전체보기 (669) N
    • 잡담 (307) N
      • 단문 (106) N
      • 장문 (32) N
      • 그림있음 (126) N
      • 나야, 언박싱 (42)
    • Coding (178) N
      • 코딩잡담 (22)
      • JavaScript (55) N
      • Python (81)
      • R (20)
    • BOJ (116)
      • [BOJ] Python (116)
    • 잔머리 엑셀 (67) N
최근 글
인기 글
최근 댓글
태그
  • #BOJ
  • #알리익스프레스
  • #잔머리엑셀
  • #Python
  • #BioPython
  • #천원마트깡
  • #Excel
  • #코딩잡담
  • #JavaScript
  • #R
전체 방문자
오늘
어제
전체
Copyright © 쭈미로운 생활 All rights reserved.
Designed by JJuum

티스토리툴바