# 数据分析与实践（专业核心）

<figure><img src="/files/UAhUiVmP2r3qD63eIem9" alt=""><figcaption><p>课程教材以老师PPT为主</p></figcaption></figure>

## 课程简介

本课程主要从数据科学基础，数据统计，数据挖掘，机器学习等方面入手，较全面地描述了数据分析的全过程。这是一门实践导向的课程，它的主要编程工具为Python，内容包括python的基础语法与应用（自学然后完成实验），如何获取数据（爬虫），如何在原始数据之上进行特征工程，统计分析，可视化实验，如何使用机器学习基础算法。课程的最后还会给出一项情景任务，之前三年给过的任务是根据某场LOL比赛的场上数据预测比赛胜率、根据某国家学生的各项能力得分预测其数学成绩和根据PISA提供的学生各项基本情况（比如：家庭收入、学校是否有音乐课等）数据来预测学生是否复读。本课程没有期末考试，平时的每项实验都很重要，课程中后期还会有一项调研报告任务，其会培养同学们查找资料、阅读论文、书写报告的能力。

## 前置知识涉及的课程

数学分析、线性代数、概率论与数理统计

## 往年经验

作为一项实践性的课程，同学们可以提前熟悉Python的使用（尤其是网络爬虫），jupyter的使用，调研报告的书写技能（可以使用Typora；老师明确表示希望看到更加美观的报告，可以提前学习latex来尝试美化自己的报告），课程中会涉及一系列机器学习基础算法，由于课程内容比较多，某些算法可能不会细讲，且作为导论课程课程深度不会过于深，有兴趣的同学可以去B站看看吴恩达的机器学习/深度学习网课作为补充。另外，基本上每节课都有当堂小测，就算一筹莫展也尽量写上姓名学号交上去。

## 与后续课程的联系

数据分析的技术是极其重要的能力，其内涵在于使用数据驱动的思想，数据分析的手段解决实际应用问题，在机器学习的领域之中也占据极其重要的位置。

## 课程资源

{% embed url="<https://rec.ustc.edu.cn/share/7ba6cc80-be48-11ed-baf8-29dee41a5f77>" %}

## 目录

<details>

<summary>数据分析与实践教学大纲</summary>

数据科学基础

数据分析入门

数据统计

数据挖掘基础

</details>


---

# Agent Instructions: Querying This Documentation

If you need additional information that is not directly available in this page, you can query the documentation dynamically by asking a question.

Perform an HTTP GET request on the current page URL with the `ask` query parameter:

```
GET https://advancedguideforsds.gitbook.io/advancedguide/pei-yang-fang-an-jie-xi/da-er-chun-ji-xue-qi/shu-ju-fen-xi-yu-shi-jian-zhuan-ye-he-xin.md?ask=<question>
```

The question should be specific, self-contained, and written in natural language.
The response will contain a direct answer to the question and relevant excerpts and sources from the documentation.

Use this mechanism when the answer is not explicitly present in the current page, you need clarification or additional context, or you want to retrieve related documentation sections.
