For many researchers, Python is a first-class tool mainly because of its libraries for storing, manipulating, and gaining insight from data. Several resources exist for individual pieces of this data science stack, but only with the Python Data Science Handbook do you get them all—IPython, NumPy, Pandas, Matplotlib, Scikit-Learn, and other related tools.
Working scientists and data crunchers familiar with reading and writing Python code will find this comprehensive desk reference ideal for tackling day-to-day issues: manipulating, transforming, and cleaning data; visualizing different types of data; and using data to build statistical or machine learning models. Quite simply, this is the must-have reference for scientific computing in Python.
With this handbook, you’ll learn how to use:
- IPython and Jupyter: provide computational environments for data scientists using Python
- NumPy: includes the ndarray for efficient storage and manipulation of dense data arrays in Python
- Pandas: features the DataFrame for efficient storage and manipulation of labeled/columnar data in Python
- Matplotlib: includes capabilities for a flexible range of data visualizations in Python
- Scikit-Learn: for efficient and clean Python implementations of the most important and established machine learning algorithms
چکیده فارسی
برای بسیاری از محققان، پایتون یک ابزار درجه یک است که عمدتاً به دلیل کتابخانههای آن برای ذخیره، دستکاری و کسب بینش از دادهها است. منابع متعددی برای تک تک تکههای این پشته علم داده وجود دارد، اما فقط با کتاب راهنمای علوم داده پایتون میتوانید همه آنها را دریافت کنید - IPython، NumPy، Pandas، Matplotlib، Scikit-Learn، و سایر ابزارهای مرتبط.
دانشمندان شاغل و خردکنندههای داده که با خواندن و نوشتن کد پایتون آشنا هستند، این مرجع جامع میز را برای مقابله با مسائل روزمره ایدهآل مییابند: دستکاری، تبدیل، و تمیز کردن دادهها. تجسم انواع مختلف داده ها؛ و استفاده از داده ها برای ساخت مدل های آماری یا یادگیری ماشینی. خیلی ساده، این مرجع ضروری برای محاسبات علمی در پایتون است.
با این کتابچه راهنما، نحوه استفاده از:
را خواهید آموخت
- IPython و Jupyter: محیطهای محاسباتی را برای دانشمندان داده با استفاده از Python فراهم میکنند
- NumPy: شامل darray برای ذخیرهسازی کارآمد و دستکاری آرایههای داده متراکم در پایتون است
- Pandas: دارای DataFrame برای ذخیرهسازی کارآمد و دستکاری دادههای برچسبدار/ستونی در پایتون
- Matplotlib: شامل قابلیتهایی برای طیف انعطافپذیری از تجسم دادهها در پایتون است
- Scikit-Learn: برای پیادهسازی مؤثر و تمیز Python از مهمترین و شناختهشدهترین الگوریتمهای یادگیری ماشین
ادامه ...
بستن ...
ISBN-13: 978-1491912058
ISBN-10: 1491912057
ادامه ...
بستن ...