돌연변이와 암 위험
- 돌연변이는 자외선, 화학물질 등 요인으로 유전자가 변형될 때 발생
- DNA 복구 시스템은 매우 효율적이며 돌연변이의 약 99%를 복구
- 중요한 영역에서 복구되지 않은 돌연변이가 반복되면 암으로 이어질 수 있음
- 흡연, 음주는 돌연변이 및 암 위험도를 높임
- 암은 다른 장기로 전이될 수 있으며, 예: 폐암이 신장, 유방으로 확산
- 암 유형은 100가지 이상이며 각각에 맞는 치료 접근 필요
암 경로
- 단일
- 인산화 단백질 하나로 암 경로 활성화 가능
- EGFR은 막 단백질로, 인산화되면 암 경로가 활성화됨
- PIP2가 PIP3로 변환되면 PDK1이 활성화
- PDK1은 AKT를 인산화해 전체 암 경로 파이프라인을 가동
암 형성 사례
- 유방 종양은 특정 경로를 통해 형성
- 골수성 백혈병은 혈액세포 변화로 발생
- 9번, 22번 염색체 간 전좌가 필라델피아 염색체 형성
- BCR-ABL 유전자가 필라델피아 염색체로부터 생성
- BCR-ABL 단백질은 티로신 키나아제로 작용해 인산화 유발
- 표적 치료제는 BCR-ABL 단백질을 특이적으로 저해 가능
- 키나아제 억제제가 BCR-ABL과 결합해 인산화 차단
- 1996년 개발된 글리벡은 필라델피아 염색체를 표적
표적 암 치료
- HER2 단백질 표적화로 암 진행 억제
- 캡슐라는 HER2와 결합해 암 치료에 관여
- 항체-약물 접합체(ADC)는 특정 단백질에 결합해 독성 화학물질을 전달, 암세포 파괴
- ADC는 면역요법보다 대세가 되는 중
- 병리학자는 HER2 여부 등 암세포 특성을 관찰
면역요법 개요
- 면역요법은 인체 면역세포를 유도해 암세포 공격
- 세포독성 T 세포가 암세포를 직접 살해
- 세포독성 T 세포 활성화를 위한 논리 필요
면역 체크포인트와 약물
- 면역 체크포인트는 세포독성 T 세포를 차단해 암 성장 허용
- 체크포인트에 결합하는 약물은 T 세포 활성화
- Anti-CTLA 약물은 T 세포 활성화 가능
- 종양 미세환경 바이오마커가 면역요법 연구 대상
- Lunit SCOPE는 IO 약물 반응 예측 연구 진행
바이오마커 연구
- Lunit SCOPE는 약물 효능 판단용 바이오마커 탐색
- UIC 요법은 단일 스칼라 값(WALDO?)으로 치료 결정
- Scope IO는 세포, 조직 수준에서 바이오마커 관찰 이미지 제공
- 각 점은 세포, 마스크는 암 영역 표시
- 세포 식별, 분할로 바이오마커 분석
- 1k×1k 패치에서 모든 세포 탐지
- 조직 식별은 마스크로 암, 체세포 등 구분
- 통계 분석으로 약물 효과 결정
- 거대 정상세포(섬모 등) 오인으로 세포 식별 난제
- 패치 단위 추론은 큰 출력 차 초래 가능
- 세포
- 유전체 바이오마커 연구(월도) 진행 중
- 월도는 포스트형 이미지, 터치파이 피치 사용, 패치 추출, 처리
EGFR 돌연변이 예측
- EGFR 돌연변이 예측은 단일 특징 분류 과제
- EGFR은 특정 암 유형에서 중요
- 아스트라제네카가 슬라이드 기반 EGFR 돌연변이 예측 과제 수행
SCOPE 개발
슬라이드 처리, 주석
- MDM 팀은 병원 슬라이드를 스캐너로 획득, 처리
- 슬라이드에 주석 달아 데이터셋 생성
- 스캔 작업 오류 잦아 재스캔 필요
- 아티팩트 모델로 문제 슬라이드 판별
- 슬라이드는 외부 SFTP → GCS → IDC 경로로 저장
- 엑셀 파일로 슬라이드 출처, 암 원발 부위 추적, 등록 오류 야기
- 수작업 입력 문제로 70% 미등록
- 각 슬라이드는 전 슬라이드 영역 사용
슬라이드 염색, 해석
- 단일 슬라이드는 여러 번 염색 가능, 이미지 사용에 영향
- IHC, H & E 등 염색법 차이로 해석 달라짐
- 4 GB 초과 슬라이드는 등록 지연 실패 발생
- IHC 염색으로 동일 슬라이드에서 상이 이미지 생성
- 대조조직 슬라이드는 염색 강도 기준이나 추론 시 제거 필요
- MDM 팀은 사진 촬영 방식으로 대조조직 제거
- AI 자동화로 대조조직 제거 어려움
- 첫 버전에서는 ROI 마스크 옵션 제외
- 일부 슬라이드는 ROI 마스크 미제공, 이유 불명
- TMA 슬라이드는 MDM이 박스 그려 처리
- 회전용 클래스, 등급 수 결정
- 문제 영역의 수동, 계산 선별
- 수동 선별 시 병리학자가 문제 영역 지정
- 과거 경험 기반 계산 방법 활용
- 블루 그리드 내 암세포 적어 분포 문제
- 학습 강화를 위해 암세포 많은 어두운 영역 가중치 증가 제안
주석 프로세스
- 주석은 AICP 백엔드 수행
- AICP 백엔드 구조는 Scope DP 주석 관리자 포함
- 큐 작업이 주석 파이프라인으로 전송
- AutoSCOPE는 주석 데이터 처리 지원
- 주석 기반 데이터셋으로 모델 학습
- 모델은 주석과 일치하도록 학습
- AI 주석은 직접 그리드 처리, 대개 반지도 학습 사용
- 인간 주석자가 AI 결과 수정 가능
자동화, 그리드 주석
- 파이프라인
- 자동 알고리즘으로 모델 생성, 데이터셋 생성
- 각 구성 요소는 SCOPE 내 파이프라인 형성
- 잘 연결된 AI 에이전트가 효율성 향상
- 자동화 수준은 효율 실현 핵심
- 그리드 주석은 주석 과정의 핵심 요소
- 작업 세트 결과를 병합해 새 데이터셋 생성
- 웹 구성 요소가 파이프라인 지원