کتابخانه علوم داده

از گنجینه و دانشنامۀ تخصصی رشتۀ مهندسی صنایع
پرش به: ناوبری، جستجو

درباره کتابخانه[ویرایش | ویرایش مبدأ]

Book-icon.png

به کتابخانه «علوم داده» خوش آمدید.

این کتابخانه محل به اشتراک‌گذاری کتاب‌ها، مقالات، سایت‌ها و سایر موارد کاربردی و موثر برای یادگیری و کاربرد علوم داده می‌باشد.

با اشتراک‌گذاری دانش، فایل‌ها و نظرات خود در غنی شدن کتابخانه ما را یاری کنید.

قوانین کتابخانه[ویرایش | ویرایش مبدأ]

Icons8-user-manual-97.jpg

لطفا فقط مطالب و کتاب‌هایی در زمینه «علوم داده» و یا بسیار مرتبط با آن بارگذاری شود.

در هنگام ایجاد تغییر در کتابخانه در حفظ یکپارچگی ظاهری آن کوشا باشید.

در صورت داشتن نقش در غنی شدن کتابخانه می‌توانید نام خود را به قسمت گردآورندگان اضافه نمایید.

مقدمه‌ای بر علم داده(Data Science)[ویرایش | ویرایش مبدأ]

Icons8-class-967.png

علم داده (Data Science)، دانشی میان‌رشته‌ای پیرامون استخراج دانش و آگاهی از مجموعه‌ای داده و اطلاعات است. علم داده از ترکیب مباحث مختلفی به وجود آمده و بر مبانی و روش‌های موجود در حوزه‌های مختلف علمی بنا شده‌است. تعدادی از این حوزه‌ها عبارتند از: ریاضیات، آمار، مهندسی داده، بازشناخت الگو و… هدف این علم، استخراج مفهوم از داده و تولید محصولات داده‌محور است. 

آقایان توماس دونپورت و دی جی پاتیل در سال ۲۰۱۲ در مقاله «علم داده: جذاب‌ترین شغل قرن بیست و یکم» متخصصین علم داده را این‌طور تعریف می‌کنند: کسانی که می‌دانند چگونه می‌توان از انبوه اطلاعات بدون ساختار پاسخ سوالهای کسب‌وکار را پیدا کرد. استنتون در سال ۲۰۱۳ علم داده را این‌طور تعریف می‌کند: علم داده رشته در حال ظهوری است که به جمع‌آوری، آماده‌سازی، تحلیل، بصری‌سازی، مدیریت و نگهداشت اطلاعات در حجم بالا می‌پردازد. دریسکول در سال ۲۰۱۴ علم داده را این‌طور تعریف می‌کند: علم داده مهندسی عمران داده‌هاست. متخصص علم داده دانشی کاربردی از داده‌ها و ابزارها دارد به علاوه درک تئوریکی دارد که مشخص می‌کند چه چیزی از نظر علمی ممکن است.

کتاب‌‌های مفاهیم علم داده[ویرایش | ویرایش مبدأ]

کتب معرفی شده در این بخش تمرکز بیشتری روی مفاهیم و حوزه‌های دانشی علوم داده دارند و در آن‌ها کمتر نیاز به برنامه نویسی پیدا خواهید کرد. با این حال ممکن است در بعضی موارد مطالعه کتاب نیاز به تسلط به برنامه نویسی نیز داشته باشد که سعی شده در توضیحات آن کتاب به این مورد اشاره گردد.

نام کتاب نویسنده توضیحات
1 داده‌کاوی و کشف دانش(جلد اول) دکتر مهدی غضنفری این کتاب به مفاهیم پایه‌ای داده‌کاوی میپردازد.
2 داده‌کاوی و کشف دانش(جلد دوم) دکتر مهدی غضنفری این کتاب به مفاهیم پایه‌ای داده‌کاوی میپردازد.
4 Elements of Data Analytic Style  Jeff Leek برای رعایت حقوق نویسنده، لینک خرید کتاب آورده شده است.
5 An Introduction to Statistical Learning Gareth James برای مطالعه این کتاب بهتر است کمی با زبان برنامه نویسی R اشنا باشید.
6 Statistical Inference for Data Science Brain caffo در این کتاب بیانی ساده اما دقیق از مباحث کاربردی آمار در حوزه علوم داده موجود است.(برای دانلود روی نام کتاب کلیک کنید)

کتاب‌‌های برنامه نویسی علم داده[ویرایش | ویرایش مبدأ]

نام کتاب نویسنده توضیحات
1 Learning Data Mining with Python Robert Layton آموزش کاربردهای پایتون در داده‌کاوی.
2 Learning Python Fabrizio Romano آموزش زبان برنامه نویسی پایتون.
3 Python Machine Learning Sebastian Raschka آموزش یادگیری ماشین با استفاده از زبان برنامه نویسی پایتون.
4 Advanced Machine Learning with Python John Hearty آموزش یادگیری ماشین پیشرفته با استفاده از زبان برنامه نویسی پایتون.
5 Regression Models for Data Science in R Brian Caffo در این کتاب بیانی ساده اما دقیق از مدل‌های رگرسیونی در حوزه علوم داده موجود است.
6 Exploratory Data Analysis with R Roger Peng این کتاب به آموزش بصری سازی و جستوجوی کارآمد میان دیتاست ها می‌پردازد.
interpretable machine learning Christoph Molnar در این کتاب به مفاهیم یادگیری ماشین پرداخته شده است.

مقالات[ویرایش | ویرایش مبدأ]

آدرس سایت توضیحات
(Python Top 10 Articles for the Past Month (v.Nov 2018 ده مقاله برتر استفاده شده با پایتون در ماه نوامبر 2018 
(The best of Python: a collection of my favorite articles from 2017 and 2018 (so far مجموعه ای از بهترین مقالات از سا‌ل‌های 2017 تا 2018 با رویکرد بر برنامه پایتون
Most Influential Data Science Research Papers for 2018 مهمترین مقالاتی که در تحقیقات علم داده (DataScience ) بیشترین تاثیر را بر پژوهش های سال 2018 داشتند .
مجموعه داده‌ها و مقالات فارسی مجموعه های بینظیر مقالات فارسی (رایگان) در حوزه‌های مختلف علوم کامپیوتر، مختص پژوهشگرانی که به دنبال شروع تحقیقات خود در این زمینه ها هستند.(مجموعه داده های داده کاوی و مجموعه مقالات فارسی)

سایت ها [ویرایش | ویرایش مبدأ]

آدرس سایت توضیحات
A tour of the top 5 sorting algorithms with Python code کدهای 5 تا از بهترین الگوریتم های مرتب سازی در پایتون
Data Science لینک ویدیوهای آموزش یادگیری علم داده دانشگاه هاروارد
Python tutorials for developers of all skill levels آموزش زبان پایتون برای برنامه نویسان در سطوح مختلف
Machine Learning | Angular منبعی مختصر و مفید از یکی از پژوهشگران ارشد گوگل برای یادگیری ماشین
coursera منبعی سرشار از دوره های متنوع آموزشی در خصوص علم داده و یادگیری ماشین
www.datacamp.com یکی از بهترین سایت ها برای آموزش علم داده
www.dataquest.io یکی از بهترین سایت ها برای آموزش علم داده2

دوره های آموزشی آنلاین علم داده[ویرایش | ویرایش مبدأ]

آدرس دوره توضیحات درباره دوره
Data science specialization یکی از بهترین دوره های ارائه شده توسط سایت کورسرا که برای کسانی که هیچ آشنایی با علم داده ندارند بسیار مناسب می باشد.
Machine learning یکی از مهمترین ابزار های علوم داده، یادگیری ماشین می باشد. این دوره یکی از بهترین پکیج های آموزش یادگیری ماشین می باشد.
Applied data science with python یکی از بهترین دوره های کاربردی علم داده که با آموزش زبان برنامه نویسی پایتون تدرسی می شود.

فیلمهای آموزشی[ویرایش | ویرایش مبدأ]

عنوان بخش عنوان فیلم فیلم توضیحات
1 Business Metrics for Data-Driven Companies
2
3
4
5
6
7
8
9
1* حل چالش های داده ها با ریاضیات از کورس ریاضیات برای یادگیری ماشین

از سایت coursera

2* انگیزه برای جبر خطی از کورس ریاضیات برای یادگیری ماشین

از سایت coursera

3* گرفتن دسته بردارها از کورس ریاضیات برای یادگیری ماشین

از سایت coursera

4* عملیات با بردارها از کورس ریاضیات برای یادگیری ماشین

از سایت coursera

5* خلاصه 1 از کورس ریاضیات برای یادگیری ماشین

از سایت coursera

Installing Python and Anaconda MAC 

تصاویر[ویرایش | ویرایش مبدأ]

گردآورندگان[ویرایش | ویرایش مبدأ]

ردیف نام گردآورنده ایمیل
1 پویا خوشابی pouya.khooshabi@gmail.com
2 عرفان نجاتی e.nejaty@gmail.com
3 مهتاب حیدرزادگان
4 آیدا محقق زاده aidamohagheghzade@gmail.com