Skip to content

Latest commit

 

History

History
18 lines (13 loc) · 1.19 KB

README.md

File metadata and controls

18 lines (13 loc) · 1.19 KB

The Effects of Input and Temperature of GPT Model on Labeling Medical Data

This repository consists of code used for "The Effects of Input and Temperature of GPT Model on Labeling Medical Data" 2024 BSc thesis. Thesis supervisor is Hendrik Šuvalov. Parts of the code were provided by the supervisor. The provided codeblocks are marked with a comments.

The code has two parts:

  1. Fine-tuning XLM-RoBERTa and estmedBERT models on GPT annotations and on human annotations
  2. Researching the data from NCBI dataset and synthetic Estonian medical dataset

There are 8 files.


GPT mudeli sisendi ja temperatuuri mõju meditsiiniliste andmete märgendamisele

See repositoorium koosneb koodist, mida kasutati "GPT mudeli sisendi ja temperatuuri mõju meditsiiniliste andmete märgendamisele" BSc lõputöös. Töö juhendajaks on Hendrik Šuvalov. Osa koodist on juhendaja poolt antud ning need on koodi sees kommentaariga ära märgitud.

Kood koosneb kahest osast:

  1. XLM-RoBERTa ja estmedBERT baasmudelite peenhäälestamine GPT mudeli märgendustega ja inimese märgendatud andmetega
  2. NCBI andmestiku ja eestikeelse sünteetilise meditsiinilise andmestiku pinnapealne uurimine

Repositooriumis on 8 faili.