머신러닝 예제 데이터

    딥 러닝/비정형 데이터 집합에 대한 여정을 시작하는 사람들에게 권장하는 다른 개방형 데이터 집합을 알고 있는 경우, 그 이유, 그 이유를 함께 제안해 주시기 바랍니다. 바이두 아폴로스케이프: 자동차, 자전거, 보행자, 건물, 가로등 등 26가지 의미 항목을 정의하는 대형 데이터 세트입니다. 머신 러닝은 금융 부문의 절호의 기회로 입증되고 있습니다. 금융 정량적 기록은 수십 년 동안 보관되어 있으므로 업계는 기계 학습에 완벽하게 적합합니다. 실제로 머신 러닝은 알고리즘 거래, 주식 시장 예측 및 사기 탐지를 위한 금융 및 투자 뱅킹을 이미 혁신하고 있습니다. 경제학에서 기계 학습은 경제 모델을 테스트하고 시민 행동을 예측하는 데 사용할 수 있습니다. HotspotQA 데이터 집합: 더 설명 가능한 질문 응답 시스템을 가능하게 하기 위해 팩트를 지원하는 강력한 감독과 함께 자연스러운 다중 홉 질문을 특징으로 하는 질문 응답 데이터 집합입니다. WPI 데이터 세트: 신호등, 보행자 및 차선 감지를 위한 데이터 세트입니다. Sentiment140: 이모티콘이 미리 제거된 160,000개의 트윗을 사용하는 인기 있는 데이터 집합입니다. [8] https://github.com/awesomedata/awesome-public-datasets#machinelearning 그러나 신경 과학, 날씨 또는 제조에 대한 데이터 세트와 같은 특정 산업에서 검색할 수도 있습니다.

    다음은 몇 가지 옵션입니다: [12] 데이터 집합 | 기계 학습 리포지토리 | MIT | https://ocw.mit.edu/courses/sloan-school-of-management/15-097-prediction-machine-learning-and-statistics-spring-2012/datasets/ 기계 학습 분야의 기본 이론을 다루었지만 물론 표면을 거의 긁지 않습니다. 미국 경제 협회(AEA): 미국 거시 경제 데이터를 찾을 수 있는 좋은 소스입니다. MNIST는 가장 인기 있는 딥 러닝 데이터 집합 중 하나입니다. 필기 숫자의 데이터 집합이며 60,000개의 예제와 10,000개의 예제로 구성된 테스트 집합이 포함되어 있습니다. 데이터 전처리에 최소한의 시간과 노력을 소비하면서 실제 데이터에 대한 학습 기술과 심층 인식 패턴을 시도하기위한 좋은 데이터베이스입니다. 이러한 이해를 통해 기계에 위에서 제공한 데이터를 제공하고 학습하도록 하겠습니다. 먼저 예측 변수 h(x)를 몇 가지 합리적인 값과 함께 초기화해야 합니다. 이제 예측 변수는 교육 세트 위에 배치할 때 다음과 같이 보입니다.