Learn data science by doing data science!
Data Science Using Python and R will get you plugged into the world’s two most widespread open-source platforms for data science: Python and R.
Data science is hot. Bloomberg called data scientist “the hottest job in America.” Python and R are the top two open-source data science tools in the world. In Data Science Using Python and R, you will learn step-by-step how to produce hands-on solutions to real-world business problems, using state-of-the-art techniques.
Data Science Using Python and R is written for the general reader with no previous analytics or programming experience. An entire chapter is dedicated to learning the basics of Python and R. Then, each chapter presents step-by-step instructions and walkthroughs for solving data science problems using Python and R.
Those with analytics experience will appreciate having a one-stop shop for learning how to do data science using Python and R. Topics covered include data preparation, exploratory data analysis, preparing to model the data, decision trees, model evaluation, misclassification costs, naïve Bayes classification, neural networks, clustering, regression modeling, dimension reduction, and association rules mining.
Further, exciting new topics such as random forests and general linear models are also included. The book emphasizes data-driven error costs to enhance profitability, which avoids the common pitfalls that may cost a company millions of dollars.
Data Science Using Python and R provides exercises at the end of every chapter, totaling over 500 exercises in the book. Readers will therefore have plenty of opportunity to test their newfound data science skills and expertise. In the Hands-on Analysis exercises, readers are challenged to solve interesting business problems using real-world data sets.
چکیده فارسی
علم داده را با انجام علم داده بیاموزید!
علوم داده با استفاده از Python و Rشما را به دو پلتفرم منبع باز جهان برای علم داده متصل میکند: Python و R. قوی>
علم داده داغ است. بلومبرگدانشمند داده را داغ ترین شغل در آمریکا نامید. پایتون و R دو ابزار منبع باز علم داده برتر در جهان هستند. در Data Science Using Python and R، گام به گام نحوه تولید راه حل های عملی برای مشکلات تجاری دنیای واقعی، با استفاده از تکنیک های پیشرفته را خواهید آموخت.
علم داده با استفاده از پایتون و R برای خواننده عمومی بدون تجربه قبلی در تحلیل یا برنامه نویسی نوشته شده است. یک فصل کامل به یادگیری اصول اولیه پایتون و R اختصاص داده شده است. سپس، هر فصل دستورالعمل ها و راه حل های گام به گام را برای حل مسائل علم داده با استفاده از پایتون و R ارائه می دهد.
کسانی که تجربه تجزیه و تحلیل دارند از داشتن یک فروشگاه یکپارچه برای یادگیری نحوه انجام علم داده با استفاده از Python و R قدردانی خواهند کرد. موضوعات تحت پوشش شامل آماده سازی داده ها، تجزیه و تحلیل داده های اکتشافی، آماده سازی برای مدل سازی داده ها، درختان تصمیم، ارزیابی مدل، طبقه بندی اشتباه است. هزینهها، طبقهبندی ساده بیز، شبکههای عصبی، خوشهبندی، مدلسازی رگرسیون، کاهش ابعاد، و استخراج قوانین مرتبط.
علاوه بر این، موضوعات جدید هیجان انگیز مانند جنگل های تصادفی و مدل های خطی عمومی نیز گنجانده شده است. این کتاب بر هزینههای خطای دادهمحور برای افزایش سودآوری تأکید میکند، که از دامهای رایجی که ممکن است میلیونها دلار برای شرکت هزینه داشته باشد جلوگیری میکند.
علوم داده با استفاده از پایتون و R تمرینهایی را در پایان هر فصل ارائه میکند که در مجموع بیش از 500 تمرین در کتاب است. بنابراین خوانندگان فرصت زیادی خواهند داشت تا مهارت ها و تخصص های جدید خود را در علم داده آزمایش کنند. در تمرینات تحلیل عملی، خوانندگان برای حل مشکلات تجاری جالب با استفاده از مجموعه داده های دنیای واقعی به چالش کشیده می شوند.
ادامه ...
بستن ...