top of page

데이터서빙개념알기 Part 1. 데이터서빙이 뭐죠?




데이터 서빙(Data Serving)은 모델 학습 후에 실제 서비스 환경에서 사용될 데이터를 효과적으로 제공하기 위한 과정을 의미합니다. 즉, 학습된 AI 모델이 실제로 예측이나 분석을 수행할 때 필요한 데이터를 신속하게, 안정적으로 제공하는 것이 목표입니다. 이번에는 바로 이 데이터 서빙에 대해서 간단하게 살펴보려 합니다.

데이터 서빙의 절차와 절차에 필요한 기술

데이터 서빙을 진행할 때 사용되는 기술 스택은 아래와 같이 다양한 단계와 관련된 기술들로 구성됩니다.

1. 데이터 수집


· 로깅:

Fluentd, Logstash, Filebeat 등의 로깅 도구를 사용하여 서비스나 애플리케이션에서발생하는 데이터를 수집합니다.


· 스트림 처리:

Apache Kafka, Apache Pulsar, Amazon Kinesis 등의플랫폼을 사용하여 실시간 데이터 스트림을 처리합니다.

2. 데이터 전처리


· 배치 처리:

Apache Spark, Apache Flink, Hadoop MapReduce 등을활용하여 대량의 데이터를 전처리합니다.


· 스트림 처리:

Apache Kafka Streams, Apache Flink, Apache Storm 등을활용하여 실시간 데이터 전처리를 수행합니다.


· 데이터 통합:

Apache NiFi, Talend, Microsoft Azure Data Factory 등을 사용하여 다양한 출처에서 수집된 데이터를 통합합니다.

3. 데이터 저장


· RDBMS:

MySQL, PostgreSQL, Oracle 등의관계형 데이터베이스를 사용하여 정형 데이터를 저장합니다.


· NoSQL:

MongoDB, Cassandra, Couchbase 등을사용하여 반정형 또는 비정형 데이터를 저장합니다.


· 타임시리즈 데이터베이스:

InfluxDB, TimescaleDB 등을 사용하여 시계열 데이터를 저장합니다.


· 분산 저장 시스템:

Hadoop HDFS, Amazon S3, Google Cloud Storage 등을사용하여 대규모 데이터를 저장합니다.

4. 데이터 조회 및 제공


· 데이터 캐싱:

Redis, Memcached 등의 캐싱 솔루션을 활용하여 빈번하게 조회되는 데이터에 빠르게 접근합니다.


· API 서버:

Flask, Django, Express.js 등의 프레임워크를 사용하여 데이터를 외부 서비스나 애플리케이션으로 제공하기 위한 API를 구현합니다.


· GraphQL:

데이터 요청과 응답을 좀 더 유연하게 처리하기 위해 GraphQL 서버를 구현할 수 있습니다.


· 데이터 조회 엔진:

Elasticsearch, Apache Solr 등의 검색 엔진을 활용하여 복잡한 데이터 조회를 빠르게 처리합니다.

이러한 기술 스택을 적절하게 조합하고 구성함으로써, 데이터 서빙 과정을 효과적으로 구축하고 최적화할 수 있습니다.


인공지능 서비스 개발에서데이터서빙의 역할과 중요성은?


· 신속한 응답:

실시간 서비스에서는 데이터 접근 속도가 매우 중요합니다. 사용자의 요청에 대한 응답 속도가 빨라야 사용자 경험이 좋아집니다.


· 안정성:

데이터 접근 중 오류나 지연이 발생하면 서비스 품질이 떨어집니다. 데이터 서빙 과정은 안정적이어야 합니다.


· 유연성:

서비스 환경은 지속적으로 변합니다. 데이터 구조나 크기, 접근 패턴 등이 바뀔 수 있으므로, 데이터 서빙 과정은 유연하게 대응할 수 있어야 합니다.


데이터 서빙은 인공지능 서비스의 핵심 부분 중 하나로, 사용자의 요청에 빠르고 정확하게 응답하기 위해 필요한 과정입니다. 각 단계별로 적합한 기술 스택을 선택하고 효율적으로 구성하는 것은 서비스의 성능과 안정성에 결정적인 영향을 미칩니다. 이러한 기술들은 지속적으로 발전하고 있으므로, 최신의 기술 동향을 파악하며 시스템을 유지 및 업데이트하는 것이 중요합니다. 마지막으로, 데이터서빙에 사용되는 각 기술 스택은 단독으로 사용되는 것이 아니라, 서로 연계되어 하나의 큰 시스템을 구성하게 됩니다. 따라서, 전체 아키텍처의 흐름과 각 기술의 특징을 이해하며 최적의 솔루션을 구축하는 것이 필요하다는 점을 잊지 말아야 합니다.


조회수 8회
bottom of page