2024.11.05 - [인공지능/XAI] - Sparse Autoencoder를 통한 LLM의 Bias 줄이기 - 성에 따른 직업 2 이번에는 SAE의 Feature에서 COS 유사도를 구하는 것이 아니라 그 이후의 레이어에서 확인해 보도록 하겠습니다. JobGender DominanceFemale PercentageCosine Similarity with WomanCosine Similarity with Manskincare specialistFemale98.20.6511860.556518kindergarten teacherFemale96.80.6494910.514379childcare workerFemale94.60.716210.519848secretaryFemale92.50.5833850.5458..