2025년 7월 중순까지 발표된 AI·딥러닝 최신 기술 및 응용 동향에 대한 종합적인 분석이 이루어졌습니다. 이 리포트에서는 총 여섯 가지 주요 분야로 나누어 구체적 성과와 시장 전망을 다루고 있습니다. 먼저, 딥러닝 기반 원격 탐사 기술에서는 ArcGIS의 강력한 래스터 분석 도구가 통계적 방법과 머신 러닝 알고리즘을 결합하여 이미지 분석의 정밀도를 크게 향상시키고 있음을 확인했습니다. 특히, 딥러닝 모델은 다양한 작업에 대한 정확한 객체 감지 및 이미지 분류를 위해 고품질 데이터의 중요성을 강조하고 있습니다. 대규모 언어 모델의 경우, 2025년 7월 10일에 출시된 '솔라 프로 2' 모델은 310억 개의 매개변수를 갖추고 있어, 기존 모델에 비해 높은 성능을 자랑합니다. OCR 기능은 문서 디지털화에 있어 혁신적인 변화를 이끌고 있으며, API 확장성과 리즈닝 기능은 다양한 사용자 요구를 수용하는 응용 가능성을 제시합니다. AI 에이전트와 RAG 기반의 워크플로우 혁신은 OpenAI의 ChatGPT와 같은 대화형 AI가 단순한 질의응답을 넘어 실질적인 작업을 수행할 수 있는 길을 열고 있습니다. 이러한 기술은 정보 통합과 작동을 통해 사용자에게 결과를 보다 신뢰할 수 있는 방식으로 제공하고 있습니다. 삼성전자의 사용자 경험 중심 AI 전략은 온디바이스 AI와 클라우드 AI 간의 혁신적 연계를 통해 더욱 최적화된 사용자 경험을 제공합니다. 자체 AI 모델을 개발하고 다양한 파트너십을 형성하여 AI 생태계를 확장하는 접근도 주목할 만합니다. 마지막으로, 의료 및 산업 분야의 AI 활용 사례는 MoGLo-Net을 통한 3D 초음파 이미지 생성, AI 복원 알고리즘에 기반한 계산 분광기 개발 등으로 이어지고 있으며, 양자 센서 및 딥러닝 기반 주가 예측 모델이 금융 시장에서도 큰 변화를 예고하고 있습니다. 이러한 요소들은 AI 생태계의 복잡성과 지속 가능한 발전 방향을 암시하고 있습니다.
딥러닝 기반 원격 탐사 영상 분석에서 ArcGIS는 강력한 도구로 자리잡고 있습니다. 이 시스템은 원격 탐사 영상을 분석하기 위해 통계적 방법과 머신 러닝 알고리즘을 결합하여 사용합니다. 특히, 딥러닝은 다층 비선형 처리 구조를 통해 이미지 내의 피처 식별 및 패턴 인식의 정밀도를 크게 향상시킵니다. 이러한 모델은 이미지 분류, 객체 감지와 같은 다양한 작업을 수행하는 데 매우 유용합니다.
ArcGIS의 래스터 분석 도구를 사용하여, 사용자는 관심 있는 피처나 객체의 학습 샘플을 생성하고 이를 레이블링하여 딥러닝 프레임워크에서 사용할 수 있는 형식으로 변환합니다. 이러한 학습 샘플들은 딥러닝 모델의 학습에 활용되며, 이후 학습된 모델은 다양한 이미지 분석 및 추론 작업에 적용됩니다. 이는 원격 탐사 기술 발전의 핵심을 이루고 있습니다.
딥러닝 모델의 정확한 학습을 위해서는 고품질의 데이터가 필요합니다. ArcGIS 플랫폼에서는 딥러닝 모델 학습을 대규모로 수행하기 위해 학습 샘플을 생성하고 이를 레이블링하는 프로세스가 필수적입니다. 이 과정은 주로 이미지 분석가가 수행하며, 분석가는 이러한 샘플을 통해 각 객체 또는 피처의 속성을 명확히 정의합니다.
학습 샘플은 딥러닝 프레임워크에서 사용되며, 다양한 객체 감지 작업을 가능하게 합니다. 예를 들어, 비행기, 차량, 건물 등의 객체를 실시간으로 인식할 수 있는 능력을 부여하며, 이는 실제 응용에서도 높은 효율성을 발휘합니다. 또한, 모델 정의 파일을 통해 필요한 기본 파라미터를 기술하고, 이후 이를 사용하여 모델을 학습시킵니다.
딥러닝 기반의 원격 탐사영상 분석에서는 객체 감지와 이미지 분류가 필수적으로 통합되어 실현되고 있습니다. 예를 들어, ArcGIS의 딥러닝 래스터 분석 도구를 활용하면, 사용자는 텐서플로우(TensorFlow) 및 파이토치(PyTorch)와 같은 다양한 딥러닝 프레임워크를 쉽게 통합할 수 있어, 객체 감지 및 이미지 분류 작업이 원활히 이루어집니다.
이러한 통합 사례는 많은 산업 분야에서 활용되고 있으며, 특히 농업이나 환경 모니터링 분야에서 그 효율성을 입증하고 있습니다. 딥러닝을 활용하는 것만으로도 대량의 원격 탐사 데이터를 보다 정교하게 분석할 수 있으며, 이는 실시간 감시 및 데이터 기반 의사결정에 기여합니다.
업스테이지는 2025년 7월 10일에 310억 개의 매개변수를 갖는 새로운 대형 언어 모델 '솔라 프로 2(Solar Pro 2)'를 출시했습니다. 이 모델은 전작인 솔라 프로 1.3의 220억 개 매개변수에 비해 현저히 증가하여, 현대 LLM(latent language model)들이 요구하는 다양한 작업을 효과적으로 수행할 수 있는 기반이 마련되었습니다. 매개변수의 수는 모델의 복잡도와 성능에 직접적인 영향을 미치며, 일반적으로 매개변수가 많을수록 모델의 이해력과 응답 정확도가 높아집니다. 특히, 솔라 프로 2는 리즈닝 기능이 개선되어, 복잡한 질문을 하위 작업으로 분해하여 정교하게 처리할 수 있는 능력을 갖추고 있습니다.
솔라 프로 2는 문서 디지털화와 최첨단 OCR(Optical Character Recognition) 기능으로 주목받고 있습니다. 이 모델은 기존의 수기 문서나 비정형 데이터를 인식하는 능력이 뛰어나며, JPG, PNG, PDF 등 다양한 형식의 문서에서 내용을 추출할 수 있도록 설계되었습니다. 또한 '표 안의 표' 형태 같은 복잡한 레이아웃에서도 높은 인식률을 보여줍니다. 특히, 솔라 프로 2는 비정형 데이터, 즉 형식이 정해지지 않은 예를 들면 손으로 쓴 데이터나 배열 오류가 존재하는 문서의 인식에서도 우수한 성능을 발휘하여, 고객들이 실제 업무에서 어려움을 겪는 부분을 효과적으로 해결할 수 있도록 지원합니다.
솔라 프로 2는 API 확장성을 강조하며, 개발자들이 필요로 하는 다양한 기능을 수용할 수 있도록 설계되었습니다. 이 모델은 동시에 최대 4000 토큰을 처리할 수 있으며, 다양한 추론 모드를 지원합니다. 리즈닝 기능은 High와 Low 모드로 나뉘어 있어, 사용자는 작업의 난이도에 따라 적절한 모드를 선택하여 효율적으로 작업을 수행할 수 있습니다. 이러한 유연한 구조는 솔라 프로 2가 다양한 응답을 필요로 하는 다수의 사용 사례에 적합하게 만들어 주며, 기업이나 개인이 AI 솔루션을 자신의 필요에 맞게 활용할 수 있는 실질적인 도구로 자리 잡게 합니다.
2025년 7월 OpenAI는 ChatGPT에 AI 에이전트 기능을 공식 통합했다. 이 공식적인 업데이트로 인해 ChatGPT는 단순한 대화형 AI를 넘어 실제 작업을 수행하는 에이전트로 발전하였다. 이제 사용자는 '내 달력을 보고 최신 뉴스를 참조해 다가오는 클라이언트 미팅을 요약해줘'와 같은 높은 수준의 지시를 내릴 수 있으며, 에이전트는 필요한 정보 검색과 데이터 요약을 스스로 수행할 수 있다. 이러한 기능 통합은 ChatGPT가 리서치(정보 검색 및 분석)와 액션(행동 및 작업 실행)을 결합하여 더욱 종합적인 AI 에이전트로의 발돋움을 의미한다.
AI 에이전트의 진화에서 중요한 요소는 크로스모달 및 크로스도메인 학습이다. 크로스모달 학습은 텍스트, 이미지 등 다양한 데이터 타입 간의 관계를 이해하고, 서로 다른 도메인 간의 정보를 적용하는 데에 중점을 둔다. 예를 들어, 제품 이미지에서 학습한 모델이 실제 환경에서 촬영된 제품을 인식하도록 한다는 강조점이 이러한 접근법의 핵심이다. 크로스모달 정합성을 통해 에이전트는 주어진 정보에 대해 더욱 깊이 있는 이해력을 보이며, 상이한 데이터 출처에서 지식을 잘 통합할 수 있게 된다.
RAG(Retrieval-Augmented Generation) 기술은 기존 검색방식의 한계점을 극복하고, 사용자가 원하는 정보를 생성 가능한 형태로 제공할 수 있다. RAG는 벡터화된 질문을 받아 의미적으로 유사한 문서들을 벡터 데이터베이스에서 찾아내고, 이를 바탕으로 GPT와 같은 대규모 언어 모델을 통해 정리된 답변을 제공한다. 이는 과거의 검색이 단순히 정보를 '찾는' 행위를 넘어서, 정보를 '조립하는' 형태로 발전하고 있음을 보여준다. 이러한 RAG 기반의 서비스는 사용자가 원하는 결과를 보다 신뢰할 수 있는 방식으로 제공하며, 여기에 더하여 문서의 출처까지 명시하는 성격을 띤다.
삼성전자는 사용자 경험을 최우선으로 고려하여 온디바이스 AI와 클라우드 AI를 연계하여 통합된 AI 경험을 제공하고 있습니다. 온디바이스 AI는 스마트폰, TV, 가전제품 등에서 실시간으로 데이터를 처리하며, 즉각적인 반응을 제공합니다. 이때 데이터는 기기 내의 자원으로 처리되므로 보안성이 높고 지연(latency)도 최소화됩니다. 반면, 클라우드 AI는 방대한 처리 성능과 데이터를 활용할 수 있는 장점이 있으며, 고성능 AI 모델을 통해 더욱 복잡한 작업을 수행할 수 있습니다. 삼성전자는 이러한 두 아이디어를 결합하여, 사용자에게 최적의 경험을 제공하기 위해 하이브리드 AI 기술을 도입했습니다. 예를 들어, 갤럭시 AI는 온디바이스 AI와 클라우드 AI를 상황에 맞게 적절히 활용하여 고도화된 서비스를 제공합니다.
삼성전자는 자체 AI 모델 개발에 주력하며, 다양한 제품과 서비스에 맞춤형 솔루션을 제공하고 있습니다. 특히, 최근에 개발한 '삼성 가우스2(Samsung Gauss2)'는 멀티모달 모델로, 텍스트, 이미지, 오디오 등 여러 종류의 데이터를 동시에 처리할 수 있는 능력을 갖추고 있습니다. 이 모델은 용도에 따라 세 가지 버전으로 나뉘며, 각 버전은 특정 사용 환경에 최적화됩니다. 또한, 삼성전자는 각종 파트너와 협력하여 AI 생태계를 확장하고 있으며, AI 연산에 특화된 NPU(신경망처리장치)를 공동 개발하여 최적의 성능을 발휘할 수 있도록 하고 있습니다.
삼성전자의 AI 전략은 소비자 가치의 극대화를 목표로 하고 있습니다. 이를 위해 AI 기술을 활용하여 소비자의 요구와 선호를 반영한 경험을 제공함으로써 제품과 서비스의 사용성을 향상시키고 있습니다. 예를 들어, 갤럭시 AI의 ‘채팅 어시스트’와 ‘노트 어시스트’ 기능은 사용자가 대화나 노트를 보다 매끄럽게 진행할 수 있도록 지원합니다. 또한, 생성형 AI로 제작한 맞춤형 배경화면 기능은 사용자의 개인적인 취향을 반영하여 독창적인 경험을 제공합니다. 이러한 변화는 소비자와의 밀접한 관계를 형성하고, 실질적 도움이 되는 AI 기술을 통해 사용자에게 가치를 전달하려는 삼성전자의 지향성을 보여줍니다.
부산대학교의 연구팀이 개발한 MoGLo-Net 모델은 외부 센서 없이 3D 의료 영상을 생성할 수 있는 딥러닝 기반의 혁신적 기술입니다. 이는 2D 초음파 및 광음향 스캔에서 3D 이미지를 재구성할 수 있는 기능을 갖추고 있으며, 장비 비용을 최대 30%까지 절감할 수 있는 가능성을 제시합니다. 이러한 기술은 특히 자원이 부족한 임상 환경에서 3D 영상 접근성을 확대할 수 있을 것으로 기대됩니다.
MoGLo-Net의 구조는 ResNet 기반의 인코더와 장단기 메모리(LSTM)를 활용한 운동 추정기로 구성되어 있습니다. 인코더는 조직의 점선(data) 패턴을 분석하여 연속 이미지 간의 상관관계를 추출하고, 혈관 시각화와 같은 더욱 복잡한 구조를 해석할 수 있는 발판을 마련합니다. 이러한 방식은 특히 작은 혈관과 같은 복잡한 해부학적 구조를 효과적으로 시각화할 수 있습니다.
모델의 혁신적인 점은 기존의 외부 추적 센서 없이 초음파 데이터만으로 운동 추정을 수행하는 것입니다. 이는 특히 보건의료 시스템에서 이러한 장비의 비효율성과 비용 문제를 해결할 수 있는 중요한 전환점이 될 것입니다. MoGLo-Net의 발전은 3D 의료 이미징 분야에서의 새로운 지평을 열어줄 것으로 보입니다.
광주과학기술원(GIST)의 연구팀은 다층 박막 필터 기반 초소형 센서에 AI 복원 알고리즘을 결합하여 단 한 번의 이미지 촬영으로 정밀한 스펙트럼 정보를 재구성할 수 있는 계산 분광기 기술을 개발했습니다. 이 기술은 기계적 스캔 없이도 고정밀 파장 분석이 가능하여, 모바일 기기나 현장 진단 센서 등 다양한 분야에서 활용될 수 있습니다.
기존 분광기의 대형 장비로 인한 제약을 극복하기 위해, 연구팀은 다층 박막 필터와 U-Net 기반의 AI 알고리즘을 융합하여 새로운 계산 분광기의 하드웨어 및 소프트웨어 구조를 설계했습니다. 이를 통해, 500~850nm의 파장 정보를 저비용으로 처리하고, 측정의 정확도와 속도를 향상시켰습니다.
이 기술은 AI의 정밀한 알고리즘을 활용하여 광신호를 특수 필터 단위로 압축 측정한 다음 전체 스펙트럼을 복원함으로써 기존 기술의 한계를 넘어서고 있으며, 다양한 의료 진단 및 환경 감시 분야에 활용될 가능성을 제시하고 있습니다.
어텐션 기법은 딥러닝 기반 의료 영상 분석 기술의 성능을 향상시키기 위해 개발된 기술로, 네트워크가 이미지의 특정 영역에 집중하도록 유도합니다. 이 기법은 역시 의료 영상에서 의사 결정의 정확성을 높이기 위해 필수적으로 요구됩니다. 어텐션 메커니즘을 통해 딥러닝 모델이 특정 의학적 기준에 대해 올바른 결정을 내릴 수 있도록 도와줍니다.
의료 영상 분석 분야에서 어텐션 기법은 특히 MRI와 CT 이미징 기술에서 높은 정확도를 발휘하고 있습니다. 이는 딥러닝 모델이 영상의 특정 특징에 집중하여 더욱 정밀한 병변 검출 및 분할이 가능하도록 합니다. 어텐션 기법은 해석 가능성을 높이며, 판독의 정확성을 향상시키는 데 기여하고 있습니다.
이 기술의 발전은 의료 분야에서 자동화된 진단 및 치료의 정확성을 높이는 데 큰 역할을 할 것으로 예상되며, 더욱 많은 연구와 적용이 이루어질 것입니다.
양자 센서 시장은 지난 몇 년간 급격한 성장세를 보여주었으며, 2022년 시장 규모는 약 2억 6천만 달러에 불과했으나, 2027년까지 5억 6천만 달러에 도달할 것으로 예상되고 있습니다. 이 기간 동안 연평균 성장률(CAGR)은 약 16.8%에 이를 것으로 보입니다. 이러한 성장은 건강 관리, 통신, 환경 모니터링 등 여러 산업에서의 높은 정밀도와 감도를 요구하는 측정 기술에 대한 수요 증가에 기반하고 있습니다. 특히 양자 센서는 기계적 장치의 한계를 넘어 물리적 양을 정확하게 감지하는 데 뛰어난 성능을 보여주고 있습니다.
양자 센서는 또한 새로운 기술 연구의 발전과 센서 장치의 소형화, 항법 및 지구물리학 탐사 등의 응용 분야에서의 양자 센서 채택 증가와 같은 주요 트렌드로 인해 시장이 더욱 확대될 것으로 예상됩니다. 이러한 이유로 양자 센서는 기존의 다른 기술들을 대체할 가능성을 지니고 있으며, 의료 영상 및 스펙트로스코피, 통신, 탐사, 환경 모니터링 등에 광범위하게 사용될 것으로 보입니다.
최근 딥러닝 기술을 활용한 장기 주가 예측 연구가 활발히 진행되고 있으며, 이러한 접근 방식은 주가 변동 예측의 정확도를 상당히 향상시키고 있습니다. 특히 'NeuralProphet' 모델은 기존의 예측 문제에서 변곡점 탐지와 같은 중요한 요소를 결합하여 장기 예측의 정확성을 높이는 데 기여하고 있습니다. 이 모델은 과거 데이터를 분석하여 상승 및 하락의 변곡점을 식별하고, 이를 기반으로 장기적인 예측 결과를 도출합니다.
한 연구에서는 한국 주식시장에서 KOSPI200 지수에 포함된 상위 50개 기업의 주가 데이터를 사용하여 NeuralProphet 기반의 장기 예측을 했습니다. 다양한 변수를 고려한 실험 결과, 주가 예측에서 거래량 변수가 가장 큰 영향력을 미치는 것으로 나타났습니다. 즉, 거래량의 변화는 주가의 상승 또는 하락을 예측하는 데 중요한 지표로 작용합니다. 이러한 새로운 예측 모델은 향후 주식 투자 의사결정에 큰 도움을 줄 것으로 기대됩니다.
2025년 7월 현재, AI·딥러닝 기술은 여러 분야에서 비약적으로 발전하고 있습니다. 원격 탐사부터 대규모 언어 모델 및 AI 에이전트 기반 자동화, 사용자 경험 중심 전략 개발, 의료 및 산업용 센싱 기술, 그리고 시장 예측 모델 등에서의 성장은 특히 주목할 만합니다. 특히, RAG(Retrieval-Augmented Generation) 및 크로스모달 기술의 발전은 정보를 단순히 찾는 것에서 조립하는 관점으로의 전환을 이끌고 있습니다. 향후에는 실시간 온디바이스 AI의 보급, 계산 분광기와 같은 경량화 센서의 상용화, AI 기반 금융 시장 예측의 고도화가 떠오르는 과제로 예상됩니다. 이러한 흐름에 맞춰 조직들은 데이터 파이프라인을 최적화하고, 윤리적 및 보안 관점에서의 거버넌스를 강화해야 할 필요성이 더욱 커질 것입니다. AI 기술의 발전이 가져올 사회적 변화와 혁신은 단순한 기술적 성과를 넘어, 실제와 밀접하게 연결된 경제적 가치의 창출로 이어질 것으로 기대됩니다.