전에 이어서 이번에는 smiles식 -> fingerprint로 변환하는 작업을 진행했다. 이렇게 변환하는 이유는 단순 smiles식이 string형태로 되어있어 기계학습 모델의 입력으로는 사용하기가 어렵다. 그래서 이 smiles식을 fingerprint로 변환하여 이러한 구조 정보를 컴퓨터가 처리하기 쉬운 이진 벡터형태로 바꿔줘야 한다. 추가로 다양한 크기와 특징들을 지닌 화학 물질들을 일정한 길이의 벡터로 생성되어 통일된 차원의 특성을 가지게 되어 분석에 용이해지기 떄문이다. train_data = pd.read_csv('train_data.csv', index_col=0) test_data = pd.read_csv('test_data.csv', index_col=0) train_data.head(..