PGR21.com
- 자유 주제로 사용할 수 있는 게시판입니다.
- 토론 게시판의 용도를 겸합니다.
Date 2025/03/02 12:33:05
Name Quantumwk
Subject [일반] 수능킬러문제는 '따위'로 만들어 버리는 GPT 딥리서치 한달 사용후기 (딥리서치에 물어볼 질문도 받음) (수정됨)
지난 2월 4일에 GPT 프로 구독 결재를 했는데 어느덧 한 달이 다 되어갑니다. 상당히 광범위한 주제에 대해 닥치는 대로 다 테스트 해봤는데 (지인들이 의뢰하는 것도 포함) 생각보다 실망스러운 경우도 있었지만 잘 쓸 경우 정말 뒤로 넘어갈 수준의 충격적인 결과를 내놓기도 합니다. 이에 대해 나름대로의 후기를 써보려 합니다.

1. 먼저 얘기할 사항
지난주를 기점으로 120회/한달 (플러스는 10회/한달)로 사용 제한량이 증가했는데 아직 120회 다 쓰지 못해서 여기 회원분들 대상으로 딥리서치에 물어볼 질문을 받아볼까 하는데 있으시면 댓글로 달아 주세요. 일단 5개 선착순으로 받고 답변 공유 드려 보겠습니다.
딥리서치에 질문하고 얘가 써주는 6페이지 짜리 보고서 읽는 것도 꽤나 머리 쓰는 작업이라 더 이상 질문하기가 좀 머리가 아프네요.....

수능 수학이나 과학 수준은 킬러 문제도 어린애 손목 비트는 정도로 가지고 논다는 게 증명되서 그건 질문 안 받습니다. 그리고 너무 밑도 끝도 없는 질문이면 제가 먼저 한번 좀 더 구체적으로 여쭤보고 그래도 너무 밑도 끝도 없으면 죄송하지만 그 다음 분 질문을 선택하겠습니다.

2. 작동 방식
- 프로 구독 유저 (120회/월), 플러스 구독 유저 (10회/월)에 한해서 입력창 밑에 망원경 모양으로 한글로 ‘심층 리서치’ 버튼이 생기게 되는 데 이걸 누르고 질문하면 됩니다. 모델을 뭘고르고 하던 의미가 없습니다. 알려진 바로는 아직 정식 출시 안된 추론 모델 full o3를 기반으로 돌아간다고 알려져 있습니다. o3-mini는 이미 출시가 됐습니다만은 o3-mini와는 거의 하늘과 땅 수준의 지능차이를 보입니다.
- 질문을 하면 유저의 질문 사항에 대한 chatGPT의 역질문이 나오고 (이건 개수 차감 안됨) 이것까지 입력하게 되면 연구가 시작되고 개수 하나 차감이 된 후에 평균 5~6분 정도의 시간 후에 한글기준 워드 6페이지 분량의 보고서가 나옵니다. 플러스에 풀리기 이전에는 10페이지 정도 뽑아 줬는데 이제는 워드 6페이지 분량이고 퀄리티도 예전에 비해서는 살짝 떨어졌습니다.

3. 성능
- 질문의 성격에 따라 많이 갈리지만 지식의 깊이에 대해서는 분야를 막론하고 대체적으로 해당분야 전문가의 평균 수준은 도달했다고 봐야 합니다.
- 같은 분야라도 정립이 아주 잘되어 있어서 학습할 거리가 많은 사안이면 전문가 평균 위고, 정립이 아직 덜 되어있고 학습할 거리가 많이 없는 사안에 대해서는 평균 아래라고 봐야 할 것 같습니다.
- 하지만 창의력과 인사이트는 해당분야 전문가 평균에 미치지 못하는 것으로 보입니다. 근데 솔직히 전문가들도 창의력 생각보다 별로인 경우는 많아서….
- 일단 수능 수학 문제는 완전 정복입니다. 이젠 수능문제 따위에 쓰기 아까울 정도의 지능입니다. 대학교 학부 수준 수학이나 전공 문제들도 아주 아주 어려운 문제 아니면 다 해치워 준다고 봐야 합니다. 일단 어느정도 정립이 잘 되어있는 분야에서 답이 명확하게 있는 문제는 틀리는 경우를 아직까지 ‘전혀’ 목격하지 못했습니다. 만약 틀렸다면 출제자가 문제를 잘못 만들었거나 인간이 만든 풀이가 틀린 게 아닌지 의심해봐야 할 정도의 정확도입니다.
- 수능 수학은 역대 수능 수학에서 정답률 가장 낮은 문제 중 하나였다는 2017년 수리 가형 30번 물어봐도 60초만에 어린애 손목 비트는 수준으로 해치웁니다. (이 문제는 o1 프로도 왔다리 갔다리 함). 임용고시 수학 증명 문제도 정확하게 한다고 합니다. (전공자가 정확하게 했다고 검증해줌)
- 기존 LLM들이 약했던 기하, 도형도 좌표 때려 박아서 무식하게 푸는 게 아니라 진짜 기하학적인 원리를 적용해서 풀어 냅니다.

2017년 수리가형 30번: https://chatgpt.com/c/67c39dfa-0b5c-8000-8cac-faf45af184bc
임용고사 수학 문제 (증명 포함): https://chatgpt.com/g/g-p-67a477335e8881919710293fd9203415-dibriseoci/c/67c017ec-8e10-8000-9c1f-b690753ffe0a

- 답이 어느정도 정해져있고, 이미 정립되어 있는 분야에 대한 문제인 경우 거의 99.9프로 정확하게 답을 내놓는다고 봐야 합니다. 어떤 분야 건 막론하고 그리고 상당히 까다롭고 어려운 문제라도…. 이걸 이용하면 이공계 연구직에서는 굉장히 파워풀하게 사용할 수 있다고 봐야 합니다. 여기와 연계해서 좀 더 자세한 얘기는 3.에서….
- 프로그래밍은 저한테는 수준 높은 프로그래밍이 필요하지는 않고, 생각보다 주변에 전문 프로그래머 분들이 없어서 테스트 표본이 부족하지만 기대치보다는 잘하는 거 같지는 않습니다. 완전 초반에 프로그램에 대한 전체적인 구조 잡을 때 유용할 수는 있어 보이는 데 사용하면서 발생하는 디테일한 에러에 대한 디버깅은 딥리서치 쓰기는 아깝고 생각보다 잘하지도 않는 것으로 보입니다. 현존 LLM 중에 프로그래밍 끝판왕이라는 클로드 3.7 쓰는 게 좋을 거 같습니다.
- 딥리서치 나온 후 ‘기획쪽은 이제 끝났다’라는 말이 있었지만 아직은 아닌거 같습니다. 새로운 분야이고 정보가 없을수록, 창의력과 인사이트가 필요할수록 실망스러운 결과를 보여 줍니다. 여기와 연계해서 더 자세한 얘기는 3.에서…


4. 어떻게 사용해야 할까?
4.1 이공계 or 사회과학 연구자들이 연구하는 도중에 내가 잘 모르는 분야에 대한 지식이 필요해서 해결해야 할 사안에 생겼을 경우.
- 어느정도 정립이 되어있는 분야의 지식으로 답을 낼 수 있을 것으로 보이나 본인이 잘 모르는 분야의 지식이고, 물어볼 사람도 딱히 없을 때 상당히 유용할겁니다.
- 예시로 지인의 부탁으로 특정 조건을 만족하는 인공위성의 궤도 찾고, 그와 관련된 추가 계산을 수행할 일이 있었는데 해당 분야의 전문가도 교과서+논문 이것저것 뒤적여야 답 줄 수 있는 specific한 사안에 대한 걸 깔끔하게 해결해줬습니다. 공짜로는 안 해줄 수준의 작업이라고 하네요. 나중에 시뮬레이터로 검증해보니 요구사항에 맞게 궤도 잘 찾아주고 추가적인 계산도 꽤 정확하게 해줬습니다. 공유하고 싶은 마음도 있는데 이건 의뢰자 연구 보안에 걸릴만한 사항이라 공유는 못할 것 같습니다.

4-2. 어렴풋이는 알고 있지만 트렌드를 잘 따라가지 못한 분야에 대한 동향에 대해 Follow up 하고 싶을 때
- 기존에 있던 지식을 정리해달라는 게 아니라 좀 모호한 질문 (미래 방향에 대해 예측해봐라, 뭔가 새로운걸 제시해봐라)을 할 경우에는 이미 그 분야에 대한 이해가 어느 정도 있다면 누구나 할 법한 뻔한 얘기를 많이 합니다.
- 하지만 그 분야 평범한 전문가 수준이 모두 알만한 내용은 정확하게 잘 정리 해줍니다. 해당 분야에 대한 트렌드를 잘 못 따라갔고 이해도가 낮은 상황에서 Follow-up 해야 할 상황일때 상당히 유용합니다. 아는 사람 통해서 물어봐도 구두로 말만 해주지 6페이지 정도의 보고서로 정리해 써달라 그러면 아무리 친해도 공짜로 엥간해서는 안 해줄 것이기 때문에 (솔직히 이런 요구를 공짜로 했다간 절연당할 수도…) 이 정도만 해줘도 매우 유용합니다.
- 이것도 밑도 끝도 없는 질문 말고 구체적으로 어떤 분야의 지식을 어느정도의 범위로 한정해서 정리가 필요한지 구체화가 필요합니다.
- 근데 아직도 open-access인 곳 말고는 출처를 제대로 못 긁어오고, 블로그 같은 곳에서 출처를 퍼오는 경우도 꽤 있어서, 내용 검증은 필요 합니다. GPT 검색엔진이 후진 것도 문제입니다. 그래서 정립이 아직 잘 안 되어있고 정보가 충분치 않은 사안에 대해서는 크로스 체크가 필요합니다. 어차피 reference를 달아 주기 때문에 크로스 체크가 어렵지는 않습니다.

5. 팁
- 질문을 좀 구체적으로 하는 게 좋고, 3,4 항목에서 이미 언급했지만 너무 창의성 요구하거나 고도의 인사이트가 필요하거나 밑도 끝도 없는 두리뭉실한 내용보다는 기존 지식을 활용해서 뭔가 구체적이고 꽤나 난이도 있는 작업을 시킬 때 가장 좋은 퍼포먼스를 보입니다.
- 딥리서치한테 질문하기 전에 좀 더 저렴한 모델한테 질문의 범위 및 구체적으로 어떤 작업을 시킬건지 먼저 어느정도 좁혀놓고 가는 게 좋습니다. 아예 대놓고 딥리서치한테 물어볼건데 어떻게 물어볼까?라고 해도 좋구요.
- 요구사항이 너무 길고 많으면 다 반영하지 못하는 느낌이고 요구사항의 각각의 항목이 길면 2~3개 정도, 짧으면 5개 정도 선에서 정리하는 게 좋습니다. 이전보다 답변길이가 짧아져서 짧게 5개 보다는 긴 요구사항 2~3개 정도로 하는 게 더 좋아 보입니다. 요구사항 개수에 맞게 chapter로 정리해서 답변하는 경향이 있음. 6페이지 보고서에서 chapter가 너무 많아 지면 요구사항마다의 깊이가 떨어질 수 밖에 없겠죠. 더 길게 해달라면 할 수는 있지만 억지로 분량만 늘려서 퀄리티가 떨어지는 느낌입니다.
- 프로 유저면 월 120개가량의 보고서를 다 읽고 (한 개당 6페이지라고 하면 720페이지) 질문하는 거만 해도 꽤 벅차기 때문에 그냥 딥리서치로 연속 질문 하면서 narrow-down 해가는 작업도 진행하는데 종종 써도 괜찮다 봅니다만, 플러스 유저면 고작 월 10개 이기 때문에 최대한 다른 모델로 질문을 잘 다듬어서 물어보는 게 좋습니다.
- 그리고 질문을 하게 되면 보고서 쓰기 직전에 역질문을 하는 데 이것도 잘 활용해야 합니다. 되묻는 거에 성의 없이 답변하지 말고 구체적으로 정해줘 보세요. 보통 유저가 너무 두리 뭉실하고 넓은 범위로 질문한 것에 대해 캐치하고 주제를 더 한정시키기 위해 물어보는 경우가 많습니다. 이 역질문을 보면서 저 스스로도 ‘내가 좀 너무 두리뭉실하고 명확하지 않게 생각하고 있었구나’라는 깨달음을 얻을 때도 있었음. 이미 답이 명확한 기존의 문제를 풀리는 거면 ‘이거 답있는 문제니까 shut up and calculate’이라고 해도 되지만…..


6. 가장 결과가 만족스러웠던 예시 3개 소개
저나 의뢰인이나 가장 만족했던 결과를 보였던 보고서에 대한 질문을 간략히 소개해봅니다. (구체적인 질문내용과 답변은 의뢰자나 저의 업무 보안 관련 사항이라 안됨. 공유는 해드리고 싶으나....)

사례 1 하기의 조건을 만족하는 인공위성 궤도를 찾아줘.
조건 1) 어쩌구 저쩌구 조건 2) 어쩌구 저쩌구 조건 3) 어쩌구 저쩌구
그리고 이 인공위성 궤도에서 이러저러한 상황에서 이러이러한 현상이 생길 수 있는데 이것에 대해서도 계산해봐.
현상 1) 어쩌구 저쩌구 2) 어쩌구 저쩌구 3) 어쩌구 저쩌구

사례 2 업체에서 견적이 왔는데 너무 비싸게 온거 같아. 이 프로젝트에 대한 개요와 견적 참부파일로 알려 줄 테니 견적을 협상할 근거를 마련해봐. 개인적으로 하기 항목에 대해서 이런식으로 협상했으면 해
1) 항목은 이런식으로 어쩌고 저쩌고 2) 항목은 이런식으로 어쩌구 저쩌구

사례 3 내 Boss가 ‘xx 제품’에 들어가는 어떤 요소에 대한 매우 난이도가 높은 시뮬레이션을 해보라고 했는데 조건과 상황은 다음과 같아.
상황 1) 어쩌구 저저구 상황 2) 어쩌구 저쩌구 상황 3) 어쩌구 저쩌구
조건 1) 어쩌구 저쩌구 조건 2) 어쩌구 저쩌구 조건 3) 어쩌구 저쩌구
SW A의 이러 저러한 Tool을 이용해서 (구체적으로 무슨 Tool인지 다 지정해줌) 어떤 식으로 시뮬레이션을 진행해야 할지 심도있고 구체적으로 가이드 해줘. SW B는 이 목적에 딱 맞는 SW는 아니지만 A에 비해서 이러저러한 장점이 있다고 하는데 우리의 조건에서 이 SW B에서 시뮬레이션 할 방법이 있는지 심도있고 구체적으로 검토 해줘.

통합규정 1.3 이용안내 인용

"Pgr은 '명문화된 삭제규정'이 반드시 필요하지 않은 분을 환영합니다.
법 없이도 사는 사람, 남에게 상처를 주지 않으면서 같이 이야기 나눌 수 있는 분이면 좋겠습니다."
25/03/02 13:24
수정 아이콘
좋은 정보 감사합니다. 잘 사용해보겠습니다.
전기쥐
25/03/02 13:32
수정 아이콘
음 의외로 코딩 실력은 생각보다는 별로인가보군요. 클로드 알아보겠습니다. 소개 감사합니다.
Quantumwk
25/03/02 13:37
수정 아이콘
(수정됨) 클로드 3.7 엄청나다더군요. 딥리서치 코딩은 그냥 에러 잡는 거 좀 물어봤는데 더 잘한다는 느낌은 못받았습니다. 일단 쓰기도 아깝구요.

전체적인 구조 잡을 때도 써봤는데 제가 하는 프로그래밍이라는 게 built-in 함수 가져다 써서 매우 구조가 단순한 MATLAB 수준이라 특출난거 못느꼈습니다. 전문 프로그래머 중에 딥리서치를 심도 있게 써본 사람을 아직 못보긴 했는데 클로드 3.7이 워낙 좋다 하니 프로그래밍 많이 하시면 써보세요.
전기쥐
25/03/02 13:40
수정 아이콘
챗지피티 가벼운 걸로 쓰고 있는데 얘가 멍청해서 한번에 코딩을 잘 못하고 여러 번 피드백해야 그럴듯한 코드를 만들더군요. 그래서 더 고급 버젼의 챗지피티는 더 코딩을 잘할까 하고 궁금했었는데 본문으로 궁금증이 해소되었네요.
Quantumwk
25/03/02 13:41
수정 아이콘
(수정됨) o3-mini-high 정도면 그래도 짧은 코딩은(300~400줄 기준) 꽤 잘한다고 그러던데 전문 프로그래머이신가 보군요. 오삼 미하로 만족 못하시면 o1pro랑 딥리서치도 크게 다를게 없습니다. 클로드 가셔야 할듯...

클로드도 LLM의 근본적인 한계상 아주 긴 코드를 한번에 오류 없이 뱉는 건 아닌거 같은데 프로그래머들은 극찬 많이 하더군요. 저도 구독 질러 봤는데 제 수준의 프로그래밍에서는 아직은 잘 모르긴 하겠지만 제 수준에서도 오삼미하보다는 확실히 잘하는 거 같습니다. 일단 오삼 미하는 말귀를 잘 못알아 들어서....
전기쥐
25/03/02 13:44
수정 아이콘
전문 프로그래머는 아닌 일반 사무직 회사원인데 코드를 만들어서 쓸 일이 좀 있습니다. 원하는 코드를 한번에 못 만들어주고 자꾸 이런저런 시행착오를 겪어서 피드백하기 이전에는 일부 결함있는 코드를 만들더군요. 그래도 몇번 시행착오 겪고 피드백 하면 최종적으로는 제대로 된 코드를 만들긴 해요.
Quantumwk
25/03/02 13:49
수정 아이콘
(수정됨) 오삼 미하는 AI 유저들 표현으로는 '코딩만 잘하는 아스퍼거 자폐아'라는 평이어서 굉장히 구체적으로 말을 잘해줘야 하긴합니다. 그래도 지시만 구체적으로 잘해주면 300줄 짜리 정도는 한큐에 깔끔하게 하긴하던데....

말귀 못 알아 듣는게 짜증나시면 O1pro가 코딩 실력은 비슷한데 말귀는 잘 알아듣긴 합니다. 물론 그걸 위해 30만원을 쓰실 필요는 없고 클로드로 가시면 깔끔하실듯. 클로드는 언어 능력도 좋기로 정평이 나있으니깐요.
25/03/02 13:52
수정 아이콘
코딩한정 o3-mini-high >= 클로드 3.6 & 3.7 > 나머지 인건 맞습니다.
전체적으론 클로드를 더 많이 쓰긴 하지만 복잡한 디버깅할때 o3-mini-high 가 더 잘잡아주는거 같긴해요.
아직 클로드 3.7 extended 는 많이 안써봐서 모르겠네요

딥리서치는 파이프라인 자체가 베이스 모델 + RL + 서치인데 이걸 코딩에 맞춘게 아니라 코딩레벨은 딥리서치가 쓰고있는 베이스 모델에 따라갈거에요.
이 베이스 모델이 아직 릴리즈안된 o3 풀 모델이란 썰이 있어서 코딩도 못하진 않을겁니다. 120회로 한정되서 별 메리트가 없을뿐
Quantumwk
25/03/02 13:57
수정 아이콘
근데 주로 현업에서 코딩에 쓴다면 작업하면서 발생하는 이런 저런 디버깅 잡는 게 주 업무인데 그런데 쓰기 아깝긴 합니다.

전문 프로그래머들이 프로그램 기초 구조 잡을 때 좀 수준 높게 사용해보신 사례를 보고 싶기는 한데 아직은 안보이네요. 일단 딥리서치도 토큰이 한글 기준으로 플러스에 풀린 후 워드 6페이지 정도, 영어 기준 8~9페이지 정도 (퀄리티가 어느정도 유지되는 수준)라 코딩에 사용하기는 좀 까다로워 보이긴 합니다.
안군시대
25/03/02 14:03
수정 아이콘
수학을 잘한다구요? 그럼 리만가설 증명좀.. 너무 궁금해요!
Quantumwk
25/03/02 14:10
수정 아이콘
(수정됨) 진지하게 답변 드리면 '이미 답이 있는 대학교 수학 학부 전공 수준 이하의 문제'에 한해서입니다. 답이 있는게 알려진 학부 수준 수학문제 들고 오시면 한번 풀게 해볼께요.
안군시대
25/03/02 22:05
수정 아이콘
쳇.. 아쉽군요. 크크크..
유체역학 시뮬레이션 쿠다 코드 짜는거나 한번 시켜봐야겠네요. 앞으로 할 프로젝트에 필요허거든요
길위의사람
25/03/02 14:08
수정 아이콘
똑같은 질문을 영어로 질문했을 때와 한국어로 질문했을 때 차이가 있나요??
있다면 어느정도인지 궁금합니다!
Quantumwk
25/03/02 14:10
수정 아이콘
(수정됨) 둘이 일대일로 비교해보지는 않아서 모르겠습니다. 영어로 했을때 대체로 더 잘하는 건 맞습니다. 답변 길이도 좀 더 길어지구요. 근데 예전 모델들에 비해서 한국어 실력도 상당한 편이라 전 그냥 한국어로 물어봅니다.

질문이 잘못되었거나 이 녀석에 잘 안맞는 성격의 작업이어서 실망스러운 경우는 있어도 한국말로 답변받아서 실망스럽다고 느낀적은 없긴 합니다.
Quantumwk
+ 25/03/03 20:42
수정 아이콘
근데 오늘 의뢰 받아서 영어로 몇 번 써봤는데 확실히 퀄리티 더 좋긴 하네요. 영어 잘하면 영어로 답변 받는 것도 좋을 것 같습니다.

영어로 된 워드 7페이지 이상(영어로 하면 더 길게 나와서...)의 글을 읽기가 좀 머리 아프고 한국어도 질문만 잘하면 충분히 퀄 좋길래 한국어로 했었는데 중요한 질문은 이제 영어로 해야 겠네요. 읽다가 짜증나면 부분부분 번역하고.....
마르틴 에덴
25/03/02 14:18
수정 아이콘
달에 2-3만원 내는 프로 버전에 있는 건가요? 왜 기능이
안 보이지;; 
Quantumwk
25/03/02 14:19
수정 아이콘
네 채팅입력창 밑에 보시면 망원경 표시로 '심층 리서치'버튼이 생겼을 겁니다. 플러스 구독중이시라면
마르틴 에덴
25/03/02 15:36
수정 아이콘
아아 프로젝트 폴더의 채팅에서는 안 보이고 일반 채팅 만들면 있군요 감사합니다!
Quantumwk
25/03/02 15:39
수정 아이콘
네 프로젝트 폴더는 이미 다 논의 한내용 정리 할때 정도에만 쓰고 평소에는 안 옮겨 놓으시는 게 좋습니다.

openAI가 너드들의 소굴이라 유저 편의성은 거의 고려가 안되어 있는 느낌이 강함.....
엔지니어
25/03/02 14:22
수정 아이콘
한달에 10개라서 귀하게 사용해야지 하고 있었는데, 사용 방법에 대한 팁을 좀 얻은 것 같아서 감사합니다!

그나저나 코딩으로 o3-mini-high가 좋다고들 하는데, 제가 사용하는건 대부분 ROS2 python환경이라서 그런지 저는 o1이 아직 더 좋은 것 같더라구요. o3-mini-high는 아주 쉬운 오류도 좀 많은 것 같은데, o1은 거의 한번에 오류 없이 해내더라구요. 혹시 다른분들도 보통 o3-mini-high가 더 좋다고 보시나요?
Quantumwk
25/03/02 14:24
수정 아이콘
벤치마크로 보나 뭐로 보내 o1 pro는 몰라도 o1보다는 오삼미하가 확실히 위라고 알고 있습니다.

근데 이 녀석은 ai유저들 표현에 의하면 '아스퍼거 자폐아'라 말귀를 잘 못 알아 듣기 때문에 지시를 굉장히 구체적으로 해줘야 합니다.

제 느낌으로는 o1 pro랑 오삼 미하랑 코딩 실력은 비슷한데 (실제 벤치마크나 이런걸 봐도) 실체감은 o1 pro가 더 좋습니다. 오삼 미하는 좀만 애매한 부분이 있으면 지 맘대로 판단해서 해버리거나 못알아 듣거나 하거든요. o1 pro는 어느정도 센스있게 알아 듣고 작업 수행하구요. o1도 o1pro랑 같은 종류의 모델이라 그럴 수 있을 거 같습니다.
엔지니어
25/03/02 14:26
수정 아이콘
표현이 공감이 가서 재미있네요.. 크크크
그나저나 o1 pro를 한달에 30 내고 써볼까 계속 고민중인데, 밥값 한다고 생각하시나요?
Quantumwk
25/03/02 14:29
수정 아이콘
(수정됨) 위에서 댓글로 논의 했지만 프로그래머이시라면 그럴 가치는 없어 보입니다. 그냥 클로드+지피티 플러스 쓰시는게....

추천하는 대상은 ai하드 유저 (이 사람들은 이미 저처럼 알아서 구독하긴 함), 이공계 연구직 , 기획 관련 업무 하는 사람이나 리서처 입니다.

근데 이공계 연구직이나 기획 쪽 리서처도 그냥 회사 or 연구비로 하길 추천 드립니다. 어차피 플러스도 이제 10개씩 받았으니깐요.

o1pro의 경우는 30만원 주고 쓸만한 정도는 아닙니다.

그리고 본문에 썼지만 ai하드 유저인 저도 지인들 것까지 온갖 테스트 다해보고 온갖 종류의 질문을 다 했는 데도 여분이 남아서 질문 받겠다 한겁니다. 120개 다 쓰는 게 힘들어요 생각보다.... 하나 물어 볼때마다 보고서 6페이지 이상 들고 오는 데 그거 다 읽고 다시 질문하고 이런 것도 완전 연구로 밥먹고 사는 사람 아니면 하기 힘들어요. 6*120이면 한달에 720페이지 보고서 읽는 건데 연구로 밥먹고 사는 사람 아니면 뽕뽑기 어렵습니다.

저도 다음달 부터는 플러스 내리고 대신에 그록3 구독 할 생각입니다. 클로드는 이미 구독했고, 제미니는 api 싼거 말고는 장점이 아직 크게 없어 보이는데 구독할 메리트는 못 느끼겠음.

이젠 완전 전문적인 연구원도 아니고, 30만원을 계속 쓰기에는 좀 부담 되네요.
엔지니어
25/03/02 14:50
수정 아이콘
종합적인 답변 너무 감사합니다. 딥리서치까지 플러스 유저에게 10개나 제공되고, GPT-4.5도 곧 제공되는거 보면 프로 쓸일이 당분간은 없겠군요.
Quantumwk
25/03/02 14:53
수정 아이콘
네 그렇기 때문에 저도 플러스로 다시 내리려고 합니다. 추후에 또 뭐가 추가되면 모르겠는데 솔직히 말하면 이제 지피티 플러스+클로드+그록3 수준으로도 잘 조합해서 쓰면 업무 및 생활에 차고 넘치게 써먹을 자신이 생겨서....
25/03/02 16:48
수정 아이콘
chatGPT 프로나 플러스가 기능이 그냥 무료로 쓰는 chatGPT보다 성능이 좋은지는 모르겠는데
chatGPT로 수학문제 물어보면 고1 모의고사 문제도 못 푸는 경우가 많더라구요. 그냥 일반적인 문제가
아니라 문제를 비틀어서 낸 거라 그런지 몰라도, 계속 일반적인 문제 푸는 방법으로 풀어서
아직은 쓸 게 못되는구나 했는데
수능 문제까지 푼다는 말을 들으니, 이미 나와 있는 문제라 학습을 해서 푸는건가? 하는 생각이 드네요.
Quantumwk
25/03/02 16:58
수정 아이콘
(수정됨) 무료로 쓰는 4o랑 본문에 써진 딥리서치 베이스 모델인 o3의 수학 실력 수준 차이는 수학과 학부생 최상위권 vs 중학생 정도일겁니다.
이미 나와 있는 문제라 학습을 해서 푸는건가? -> 전혀 아닙니다. 딥리서치에 쓰이는 모델은 추론모델 그것도 현재 시장에 출시된 추론 모델 중 최상위권이라서 수학을 잘하는 겁니다.

단순히 4o가 나빠서라기 보다 (o3도 4o 기반 모델인지라) 비추론모델이라서 수학에 매우 약한건데 추론모델, 비추론 모델까지 얘기하기는 좀 주제에서 벗어나지만 간단히 얘기해볼께요.

비추론 모델은 유저가 질문하는 즉시 주저리 주저리 반사적으로 대답하는 거고 추론 모델은 물어보고 나서 쉬운건 1분, 어려운건 5~6분 정도 AI가 생각하고 검증하면서 (인간의 생각이랑 같다고 보기는 힘들지만) 일종의 '추론'을 하면서 답을 찾아간다고 보면 됩니다.

멀리 갈것도 없이 무료모델 딥시크에서 채팅창 밑에 R1 키고 써보시면 본인이 무슨 생각을 하고 있는지 연한 회색으로 한참 뜨다가 완료 되면 답변을 시작하는데 이게 추론 모델입니다. 딥시크 정도만 되도 고1 모의고사 쉬운건 어느정도 풀거에요. 제가 테스트 좀 해봤음.

무료모델들 성능이 실망스럽다면 딥시크에서 R1 버튼 누르고 써보세요. 딥시크 R1 정도면 유료구독시 제공되는 중간급 추론 모델 수준은 됩니다. 공짜로 유료결제 시 중간급 추론 AI 성능이 어느정도 되는 지 맛볼 수 있어요. 그러니 난리가 났던거죠....
25/03/02 17:07
수정 아이콘
급 관심이 생기는군요!! 본문에 나와있는 chatgpt는 어디서 구하나요? 그리고 핸드폰으로도 되나요?
Quantumwk
25/03/02 17:09
수정 아이콘
(수정됨) GPT plus 구독하면 사용가능합니다. 딥리서치 쓰는 법은 본문에 설명해놨습니다.

그리고 딥리서치 갈 거 없이 (수능문제는 이제 딥리서치한테는 너무 아까움) 플러스 구독하면 제공되는 추론 모델 o3-mini-high만 써도 상위권 문제 까지 대부분 다 풉니다. 폰으로도 플레이스토어에서 앱깔면 당연히 됩니다.

딥식 써보라고 하고 싶은데 제가 간과한 사실이 1~2주 전에 한국 정부에서 deepseek 신규 가입 막아 버려서 아이디가 없는 상태면 못쓸겁니다. 앱스토어에서도 사라졌구요.
25/03/02 17:11
수정 아이콘
chatgpt에서 plus 구독 눌러 나오는 한달에 29000원짜리 말하는거죠?
Quantumwk
25/03/02 17:12
수정 아이콘
25/03/02 17:13
수정 아이콘
호기심 해결을 위해 일단 29000원을 투자해보겠습니다 ^0^
Quantumwk
25/03/02 17:14
수정 아이콘
o3-mini-high로 놓고 수학문제 몇 개 물어보세요. 문제만 제대로 알려주면 엥간한 수능 모의고사 or 수능은 한 두 문제 빼고는 다 맞출겁니다.
25/03/02 17:16
수정 아이콘
o3-mini-high로 놓는다는게 어디에서 설정하는건가요?
Quantumwk
25/03/02 17:17
수정 아이콘
workbee 님// 좌측 상단에 보시면 모델 고를 수 있습니다. 아마 지금은 4o라고 써져 있을 겁니다.
25/03/02 17:24
수정 아이콘
Quantumwk 님// 이제 제대로 된 답을 내놨군요.
실제 모의고사 문제를 쌤이 변형해서 만든 문제인데 문제에 오류가 있었습니다.
아까까지 질문했을 땐, 계속 엉뚱하게 풀었고, 이번에는 문에에서 모순이 발생해서
실현 불가능한 상황이라고 하네요.
25/03/02 17:30
수정 아이콘
Quantumwk 님// 또 다른 문제도 물어봤는데 푸는 방법만 말하고 풀지는 않네요. 하하
이러 저러한 계산과정을 거치면 답은 3, 6, 9, 12, 15중에 하나가 되고 실제로 많은 기출/유사문제에서
답이 9로 나오는 예가 흔합니다. 라고 하는군요.
제가 수학강사라서 계산 귀찮은건 시켜 보려 했는데, 아직 쓸 일이 없는걸로 결론!
실제 나온 모의고사나 수능은 제대로 계산할거 같긴 하군요.
Quantumwk
25/03/02 17:33
수정 아이콘
workbee 님// 실제 나온 모의고사나 수능은 제대로 계산할거 같긴 하군요. -> 이건 상관 없습니다.

어차피 지금까지 질문을 한분이 없어서 문제 저한테 주시면 제가 딥리서치에 한번 물어보겠습니다. 수능문제지만 어쨌든 오삼미하가 해메는 건 한번 물어볼 수도 있죠. 어차피 질문한 분도 지금까지 없고....
o3-mini-high(오삼미하)는 종종 틀리기도 하니 너무 100프로 신뢰하면 안됩니다.
25/03/02 17:34
수정 아이콘
Quantumwk 님// 이것도 물어보는 요령이 필요한가보군요. 넵 쪽지로 제 메일주소 남길테니 메일 하나주시면 그리로 보내겠습니다.
Quantumwk
25/03/02 17:37
수정 아이콘
workbee 님// 답이 정해진 수학문제는 물어보는 요령은 필요 없는데 오삼미하가 수학은 잘하는데 언어 능력이 딸려서 문제가 꼬이고 애매해지면 헤매는 경우가 있습니다.
Quantumwk
25/03/02 17:47
수정 아이콘
(수정됨) workbee 님// 음 문제 받아보니 복잡해보이지는 않아서 혹시 문제 알려줄때 오류가 있었나 해서 오삼미하로 먼저 풀어 봤습니다.

둘다 답 3번이 맞나요? 만약에 틀리면 딥리서치 가보겠습니다. 근데 두번째 문제는 풀이 보니 잘못푼거 같은 느낌이.... 첫번째는 맞을 확률 있어 보이구요.

아 두번째 문제 인식 과정에 오류가 있었네요. 근데 다시 바꾸고 풀어도 3번이네요.
25/03/02 18:04
수정 아이콘
뭔가 물어보는 요령이 있나요? 질문을 뭐라고 하셨나요? 전 그냥 "풀이와 답을 알려줘" 했더니 저런 식으로 말하더라구요
Quantumwk
25/03/02 18:05
수정 아이콘
(수정됨) 이미지 인식에서 오류가 났을 수도 있습니다. 전 gpt 이미지&텍스트 번역이라는 걸 쓰거나 구글 제미니같은데서 이미지 인식 시켜서 문제 제대로 읽었는지 확인 후 그거 복사해서 풀리게 합니다. 잘못 인식 했으면 잘못 인식한 부분 제가 직접 고치구요. 바로 이미지 던져주면 문제를 잘못 읽는 경우가 많아요. 혹시 답 맞으면 공유 드릴께요.
25/03/02 18:09
수정 아이콘
답 맞습니다. 여기에 입력을 못할테니 메일로 캡쳐된걸 보내주시면 감사하겠습니다.
25/03/02 18:20
수정 아이콘
질문으느 뭐라고 했나요?
Quantumwk
25/03/02 18:25
수정 아이콘
말씀 드렸듯이 이미지 인식해주는 모델을 써야 합니다. 질문은 링크 건 곳에 처음에 써진거고 그걸 한 방법은 이미지 인식 해주는 모델을 써서 한겁니다. gpt안에도 이미지 인식 모델이 있는데 앱에서는 안뜨고 pc에서만 보입니다.
25/03/02 18:22
수정 아이콘
뭔가 그냥 물어보는게 아니라 사전작업을 하면 더 잘 대답해주는군요. 여러번 해봐야 요령이 늘겠군요
Quantumwk
25/03/02 18:26
수정 아이콘
(수정됨) 수학문제는 그냥 문제 그대로 물어보면 되고, 다만 문제를 정확하게 옮겨주는 게 중요합니다. latex 쓸 줄 아시면 직접 latex 스타일로 치셔도 되구요. 이거 개발을 너드들이 한거라 유저 배려가 잘 안되어 있어서 제대로 쓰려면 좀 불편하긴 합니다.
25/03/02 19:17
수정 아이콘
이건 물어보는것도 능력이군요. 링크에 있는 수식 복사해서 붙여넣기해도, 제가 하면 안됩니다. ^^
어짜피 한 달 쓸테니 천천히 연구해봐서 잘 써먹겠다 싶으면 하는거고 아니면 나중에 더 발전되서
저 같은 사람도 쉽게 쓸 수 있게 되면 해야겠군요.
여러가지로 사용법을 알려줘서 고맙습니다. 요즘 관심은 있었는데 하나도 몰라서 그냥 구경만
했었는데, 방향은 잡게 됐네요.
스폰지뚱
25/03/02 18:02
수정 아이콘
월 200불의 프로를 저도 비슷하게 2월들어 처음 구독해 쓰고 있습니다. 이런 글을 올려주시면 안써본 분들에게 좋은 참고가 될것 같은데 상세하게 잘 설명해주시고 예시까지 제공해 주시니 ㅡ 뭔가 쓰신 글고 챗지피티에 개요 요청하셔서 쓰신? 흐흐 

저는 한달 끊고 50-60개 쯤 쓴거 같은데 그때그때 궁금한 소재 있으면 보고서 만들어 달라고 해서 만든담에 심심할 때 읽으려고 모으는데 점점 밀리고 있어요. 

제 나름의 사용방법이라면 우선 원천 소스로 뉴스나 유튜브영상 스크립트 등 관심 주제를 배경설명으로 긁어다 제공하는데 ㅡ 우선 클로드에 넣어서 이걸로 심층 보고서용 프롬프트를 상세하게 만듭니다. 그리고서 이걸 적당한 범위나 깊이가 되도록 다듬은 후이 복사해서 다시 딥리서치용으로 입력하구요. 쌩짜로 딥리서치 프롬프트 만드는 것보다 더 체계적으로 나오는게 사실입니다. 챗지피티도 이렇게 넣어주면 좋아하더군요. 흐흐
 
Quantumwk
25/03/02 18:04
수정 아이콘
(수정됨) 전 이공계열이라 뉴스나 유튜브 영상으로 소스를 만들일이 잘 없어서.... 직종에 따라 굉장히 유용한 방법으로 보이긴 합니다.
sionatlasia
25/03/03 13:12
수정 아이콘
혹시 죄송한데 클로드로 심층보고서용 프롬프트는 어떻게 만드시나요? 전 클로드로 PPT 슬라이드 단어 뽑아내기 위주로 사용해서..
꿀팁 공유 가능하시면 정말 감사하겠습니다
설탕가루인형형
25/03/02 20:12
수정 아이콘
요즘 인스타그램 활성화에 관심이 많은데 이런거도 정리해 주려나요?
방법은 뻔한데 좀 더 편하게 할 방법이 있을까 싶어서요
Quantumwk
25/03/02 20:25
수정 아이콘
좀 더 구체화 시켜서 말씀 해주시면 제가 딥리서치에 물어봐 드리겠습니다. 질문 하시는 분이 없어서 흐흐
설탕가루인형형
25/03/02 20:46
수정 아이콘
음...구체적으로 생각은 안해봤는데
인스타그램 팔로어가 많고 관리가 잘 되는 계정(브랜드나 기업계정) 예시
주요 업로드 컨텐츠 특징
해시태그 관리
계정 생성 후 초기 컨텐츠와 팔로어 수 증감
같은게 생각 납니다.

이분야는 검색해보면 광고만 많아서 걸러보기가 힘드네요 ㅠㅠ
Quantumwk
25/03/02 20:47
수정 아이콘
(수정됨) 한번 물어보겠습니다. 인스타 계정 파는 분야는 어떤 분야를 생각하고 계신지도 말씀 해주실 수 있나요? 그냥 인스타 계정 활성화면 너무 범위가 넓어서.....
Quantumwk
25/03/02 22:16
수정 아이콘
(수정됨) 일단 그냥 물어 봤습니다. 역시나 무슨 분야 원하는 지 역질문 하네요. 일단 역질문도 대충 답변 후의 결과입니다.

https://chatgpt.com/share/67c459f0-1adc-8000-b4bd-8d96075c4634

나름 답변은 열심히 해준거 같은데 질문범위가 넓어서 그런지 좀 뻔하고 두리 뭉실한 감은 있네요.
마그데부르크
25/03/02 20:39
수정 아이콘
저는 요즘 그록3 씁니다

그록3이 무료ai챗중에선 최고인거같아요
Quantumwk
25/03/02 20:47
수정 아이콘
그록3 잘 뽑혔다고 하더군요. 특히 영어로 하면 더.... 그래서 이번 결제일에 지피티 플러스로 다운시키고 대신에 그록3 구독해볼 생각입니다.
25/03/02 20:55
수정 아이콘
IMO 수학문제 푸는 AI 들도 조합론쪽에 취약하다고 합니다..
(제가 알기로 작년 IMO 문제에서 은상급 실적을 낸 구글 딥마인드도 조합론 2문제는 못 풀고 나머지 4문제를 풀었다고 합니다.)
혹시 수학쪽으로 발전 정도를 확인하시려면 작년 IMO 수학문제중에 조합론쪽 2문제를 한번 풀려보시죠..
Quantumwk
25/03/02 20:56
수정 아이콘
(수정됨) 딥마인드가 못 푼 문제면 당연히 이걸로도 못 풀거 같네요 크크 어차피 쿼리 남으니 한번 시도해보겠습니다
25/03/02 23:27
수정 아이콘
혹시 쿼리 해보시게 되면 결과도 공유해주시면 정말 감사하겠습니다.
Quantumwk
25/03/02 23:41
수정 아이콘
2024년 imo 5번,6번인가요? 퍼플렉시티+R1에 물어보니 그렇다는데 제가 일반적인 이공계 학부 수학 or 대학원 일부 정도 수학밖에 몰라서 문제를 봐도 판단이 안됩니다.

5번은 Turbo the snail plays a game.... 6번은 Let Q be the set of rational numbers. 이런식으로 시작하네요.
25/03/03 11:44
수정 아이콘
imo 3번과 5번을 못 푼것으로 알고 있습니다.
(게다가 이 2문제가 완전 새로운 유형이라. 조합론이 원래 유형화가 잘 안되긴 하지만요..)
6번은 엄청 오래 걸려서 풀었다고 합니다.
Quantumwk
25/03/03 13:21
수정 아이콘
3번은 증명문제라 맞게 했는지 제가 검증을 못하겠고, 5번은 정답 맞췄는데 대놓고 soultion 보고 베껴서 이건 맞췄다고 볼수가 없네요. 3번은 일단 출처 안 달아 놓은 걸로 봐서 베꼈다는 혐의(?)는 없습니다

3번 https://chatgpt.com/share/67c52d74-2f0c-8000-98e8-33ba0f5a08dd
5번 https://chatgpt.com/share/67c52e23-73f8-8000-beb2-60096f6203ec
척척석사
25/03/02 22:34
수정 아이콘
혹시 인터넷에서 검색으로 잘 안 걸리는 파일 업로드해서 학습시켜보는 것도 가능한가요?
관련분야 논문들이나 아티클들이 1차 검색에서 막혀있는 경우가 많은데 ai한테 읽어보라고 시키면 뭔가 뽑아낼 게 있을 것 같아서요
Quantumwk
25/03/02 22:42
수정 아이콘
(수정됨) 꽤 많이 쓰는 방법입니다. 첨부파일 던져주고 거기있는 내용 참고하라할수 있음. 근데 해보면 아주 긴문서를 한번에 읽지는 못하고 대략 워드 6~7페이지 정도씩 쪼개서 주면 되었던거 같습니다
sionatlasia
25/03/03 13:11
수정 아이콘
안녕하세요, 리서치/컨설팅 직무에서도 사용할만 할까요?
이게 백그라운드 리서치가 워낙 시간을 꽤 잡아먹는 분야이다 보니까 딥리서치 사용할까말까 고민되네요. 원래 클로드 코파일럿 지피티 이렇게 썼는데 차라리 정리하고 지피티 200달러 하나만 쓸까 싶기도 하고요.
Quantumwk
25/03/03 13:23
수정 아이콘
(수정됨) 리서치, 컨설팅 업무에 딱 안성 맞춤입니다. 회사돈으로 구독 할 수 있으면 무조건 해야 합니다.

컨설팅시 구체적인 전략과 인사이트 제시는 아직 사람의 몫이라고 보이지만 백그라운드 리서치는 기가 막히게 해줍니다. 실망스럽다면 너무 최신의 내용이고 정립이 거의 안되어 있는 분야거나 (사람이라도 최전선에 있는 연구자 아니면 의미 있는 정보 거의 없는 경우) 질문을 이상하게 했거나 둘중 하나일겁니다. 아직도 환각이 100프로 제거 된건 아니지만 어차피 reference도 같이 달아주니 크로스 체크 같이 하면 됩니다.

본문에 써있듯이 이미 해당 분야에 대해 전문가 수준이라면 크게 별거 없는 내용이지만, 그게 아니라면 정말 유용해요.
sionatlasia
25/03/03 13:32
수정 아이콘
회삿돈으로 구독시켜준 pro가 있는데 이게 기록이 남다 보니까 크크 개인용으로 하나 할까 싶습니다.
가격이 워낙 쎄서 부담이긴 한데 일의 능률이 올라갈 수 있으면 고려해봐야겠네요. 조언 감사합니다
목록 삭게로! 맨위로
번호 제목 이름 날짜 조회 추천
공지 [일반] [공지]자유게시판 운영위원을 상시 모집합니다. jjohny=쿠마 25/02/08 4087 11
공지 [일반] [공지]자유게시판 비상운영체제 안내 [212] jjohny=쿠마 25/02/08 13940 19
공지 [정치] [공지] 정치카테고리 운영 규칙을 변경합니다. [허들 적용 완료] [126] 오호 20/12/30 294680 0
공지 [일반] 자유게시판 글 작성시의 표현 사용에 대해 다시 공지드립니다. [16] empty 19/02/25 351450 10
공지 [일반] [필독] 성인 정보를 포함하는 글에 대한 공지입니다 [51] OrBef 16/05/03 472688 31
공지 [일반] 통합 규정(2019.11.8. 개정) [2] jjohny=쿠마 19/11/08 353440 3
103866 [일반] 국내 외국인 유입증가에 대한 한 활동가의 견해 [19] 아스라이1065 25/03/03 1065 3
103865 [일반] 아카펠라 최초로 빌보드 1위를 기록하며 많은 사람들을 감동시킨 명곡 @.@ [1] nexon1323 25/03/03 1323 2
103864 [일반] <컴플리트 언노운> - 시대와 순간이 예술가를 벼리는 법. (약스포) aDayInTheLife3156 25/03/02 3156 2
103863 [일반] 즐겨보던 유튜브 채널이 사라졌습니다. [239] 맥스훼인18715 25/03/02 18715 42
103862 [일반] 수능킬러문제는 '따위'로 만들어 버리는 GPT 딥리서치 한달 사용후기 (딥리서치에 물어볼 질문도 받음) [71] Quantumwk8097 25/03/02 8097 15
103861 [일반] 트럼프 젤렌스키 회담 전문으로 AI 4개 성능 비교 해봤습니다 [32] 여기7484 25/03/02 7484 8
103860 [일반] 트럼프-젤렌스키 회담(2.28)의 전체 방송영상과 대화 번역본 [89] 스폰지뚱11603 25/03/02 11603 3
103859 [일반] 한국문화콘텐츠의 두 수원지에 대하여 [5] meson4775 25/03/01 4775 8
103858 [일반] 정치글의 카테고리는 어디까지일까요? [100] 烏鳳4922 25/03/01 4922 0
103857 [일반] 국제정치의 현실주의자라고 이완용의 동조자는 아닙니다. [250] 스폰지뚱13868 25/03/01 13868 24
103855 [일반] 기사 젤렌스키, 트럼프와 말다툼 협상후 만찬 준비중에 백악관에서 쫓겨나다. [436] 깐부20083 25/03/01 20083 3
103854 [일반] (일상/약혐?) 쿠키를 먹다가 금니가 빠졌다 [14] VictoryFood4483 25/03/01 4483 0
103853 [일반] 쫄보의 주식 투자 실패 이야기 (1) [33] 김치와라면4799 25/02/28 4799 5
103852 [일반] RX 9070 / XT 시리즈 그래픽 카드 중국 가격 공개 [35] SAS Tony Parker 5342 25/02/28 5342 1
103851 [일반] 요즘 AI 보이스 모드 소식 몇 개 [9] 깃털달린뱀4154 25/02/28 4154 2
103850 [일반] 방금 국제표준화기구(ISO) 에서 받은 미국 정부에 대한 이메일 어매이징 하네요. [70] 성야무인11295 25/02/28 11295 11
103849 [일반] 주식투자관련해서 개인적으로 중요하다 생각하는 원칙 3개 [33] Quantumwk4448 25/02/28 4448 5
목록 이전 다음
댓글

+ : 최근 1시간내에 달린 댓글
+ : 최근 2시간내에 달린 댓글
맨 위로