분류 전체보기
-
[강화학습] chatgpt랑 공부하는 강화학습: Q-learning, FrozenLake - 3배우기 - computer로 하는거 2025. 4. 13. 17:11
지난번까지는 학습 코드에 대해 살펴봤다. 이번 글에서는 학습이 끝난 agent가 어떻게 행동하는지 살펴보겠다.우선 main함수를 다시 살펴보면def main(): train_env = gym.make("FrozenLake-v1", map_name="4x4", is_slippery=True) play_env = gym.make("FrozenLake-v1", map_name="4x4", is_slippery=True, render_mode="human") q_table = train_on_frozen_lake(train_env) # 학습만 수행 play_trained_agent(play_env, q_table) # 학습된 q_table로 결과 보기 if __name__ ..
-
[강화학습] chatgpt랑 공부하는 강화학습: Q-learning, FrozenLake - 2배우기 - computer로 하는거 2025. 4. 10. 22:27
지난번에는 학습, 실행 코드를 정리했었다. 이번 글에서는 하나씩 천천히 살펴보도록 하겠다. (전체 코드는 이전 글 참조) 1. main 함수:우선 메인함수는 아래와 같다. main 함수는 학습을 수행하고, 실제로 특정 환경에서 학습된 agent를 동작시키는 역할을 한다.def main(): train_env = gym.make("FrozenLake-v1", map_name="4x4", is_slippery=True) play_env = gym.make("FrozenLake-v1", map_name="4x4", is_slippery=True, render_mode="human") q_table = train_on_frozen_lake(train_env) # 학습만 수행 play_tr..
-
[강화학습] chatgpt랑 공부하는 강화학습: Q-learning, FrozenLake - 1배우기 - computer로 하는거 2025. 4. 10. 22:22
인공지능 관련 기술들에 익숙해지면서 글쓰는 연습도 할겸 블로그에 공부하거나 접한 내용들을 정리하려고 한다. 회사에서 쓰는 기술들을 블로그에 그대로 쓰는건 좀 찝찝해서 아예 관련없는 강화학습 관련 내용을 작성하기로 결정했다. 강화학습 관련 용어라고는 상태, 액션, 보상 정도만 아는 상태에서 시작하는데, 강의를 듣는 방식으로 공부하면 저작권 문제도 있을수 있을것 같고, 재미도 없을것 같아 chatGPT한테 물어보면서 공부를 하려고 한다.뭔가를 처음 배우기 시작할때 chatGPT를 이용하는건 처음인데, 혹시 다른 사람들도 내가 하는 걸 참고해서 chatGPT를 이용해서 배워보거나 이것저것 시도해보는데 도움이 되면 좋겠다. 일단은 대화 내용을 많이 가져와서 내가 어떤식으로 chatGPT를 이용하는지 다른 사람들..
-
고치고 싶은 습관생각 2022. 10. 7. 13:29
고치고 싶은 습관들이 있다.지금 당장 생각나는 것은 아래의 두 가지이다. 나는 잠깐이라도 시간이 나면 십중팔구 둘 중 한가지 행동을 한다. 1. 손으로 얼굴에 난 털 뽑기2. 무의식적으로 핸드폰 하기 위 두 습관을 고치기 위해서는 어떻게 해야 할까.개리 마커스가 쓴 책의 제목이기도 한 "클루지 (Kluge)" 라는 개념이 있다. 불나방은 과거에 생존에 유리하여 빛을 향해 날아가도록 진화했지만 현대의 도시에서 이 행동은 가로등에 갇혀 죽는 결과만을 낳는다. 한가지 예시로 간단하게 설명하면 이것이 바로 클루지이다. 이는 인간에게도 적용되어, 클루지를 인식하고 바꾸는 것이 현대 사회에서 더 나은 인간으로 나아갈 수 있는 방법 중 하나라고 역행자라는 책에서 자청은 얘기한다. 1. 손으로 얼굴에 난 털 뽑기1번..