当前位置: 首页 > news >正文

建模步骤 3 :数据探索(EDA) — 1、初步了解数据:自定义函数

👏

1、自定义函数概述
--(1)title()
--(2)df_table(df)
--(3)df_style(df)
--(4)des_table(df)
--(5)des_chart(df)

1、自定义函数概述

尝试自己创建一个名为my_package模块,该模块中存放一些自定义的数据分析函数,可以重复调用。如下图在当前目录下,创建一个名为my_package的文件夹,在该文件夹下面创建一个名为__pycache__的子文件夹;然后创建两个python模块(View.pyDEA.py);接着在这两个模块中定义函数。

👏

具体函数如下:

函数解释存放模块
title('')显示一个标题View.py
df_table(df)用表格的方式展示数据框View.py
df_style(df)为数据框添加边框或热力图View.py
des_table(df)数据框概要表DEA.py
des_chart(df)数据框每个特征分布可视化DEA.py
......

上表是我在初步了解数据过程中的几个自定义的函数,主要是将上一篇文章中的常用函数组合在一起使用。

(1)title()

# 导入库里面的模块,然后调用函数 from my_package import View View.title('Good') View.title('Good', style="#512b58") View.title('Good', style="bold #fe346e") View.title('Good', count=80)

(2)df_table(df)

import numpy as np import pandas as pd df = pd.DataFrame( np.random.randn(4, 6) , columns=list("ABCDEF") ) df

from my_package import View # 参数 tablefmt 参考 tabulate 库 # 可能对中文支持不是很友好 print('\n') View.df_table(df) View.df_table(df, tablefmt="psql") View.df_table(df, tablefmt="rounded_grid")

(3)df_style(df)

from my_package import View View.df_style(df, background=True)

from my_package import View View.df_style(df, background=False)

(4)des_table(df)

import os file = os.path.join('datasets','titanic','train.csv') import pandas as pd df = pd.read_csv(file) df.head()

from my_package import DEA DEA.des_table(df)

(5)des_chart(df)

from my_package import DEA DEA.des_chart(df)

👏

总结:以上是我在初步了解数据过程中的几个自定义的函数,主要是将上一篇文章中的常用函数组合在一起使用。并且,尝试创建了一个简单的库来存储,方便重复执行。更多的pandas函数可以查看 pandas 函数

  • 以上函数代码存放位置:
    https://gitee.com/wwj2011125/my-package

  • Python 中的变量、函数、类、模块和库的简单解释

Python 端到端的机器学习

AI入门:详细介绍机器学习建模过程,步骤细节;以及人工智能的分阶段学习线路图。

🚀 点击查看

统计学习\机器学习\深度学习算法

介绍有关统计学习,机器学习,深度学习的算法。

🚀 点击查看

SQL + Pandas 练习题

SQL 练习题目,使用 Pandas 库实现,使用 Sqlalchemy 库查看 SQL 代码血缘关系。

🚀 点击查看

Python 数据可视化

介绍了有关 Matplotlib,Seaborn,Plotly 几个 Python 绘图库的简单使用。

🚀 点击查看
http://www.cnnetsun.cn/news/4104.html

相关文章:

  • 【连载】零基础跟我学做AI Agent(第4课:用Autogen开发一个学霸Agent)
  • Wan2.2-T2V-A14B支持复杂场景描述的理解机制剖析
  • BiliFM:高效下载B站音频的专业工具
  • WanVideo FP8量化模型:AI视频生成新标杆
  • AsyncHttpClient:构建高性能异步HTTP和WebSocket客户端的完整指南
  • 2025企业AI网关终极指南:3大架构策略实现多模型统一治理
  • 2025年LangChain与LangGraph终极对比:从高层框架到底层编排,一篇掌握全貌!
  • GitHub宝藏项目:BuildingAI —— 企业级开源智能体搭建平台!
  • GPT-5.2:让创作更轻松,还是让创意变得机械化?
  • AIGC 重构内容工厂:从 1 分钟快讯到课程闭环,效率提升 10 倍的秘密
  • 扁平化组织架构图绘制 在线免费自定义工具
  • 终极指南:如何将文件嵌入C++程序实现独立可执行文件
  • Open Interface:用AI大脑为你的电脑装上智能驾驶系统
  • Wan2.2-T2V-A14B实现沙漠绿洲生态演变长期模拟
  • mybatis开发
  • swagger的基本使用
  • Caesium图像压缩器容器系统终极指南:掌握高级布局与外观定制
  • Wan2.2-T2V-A14B在新能源汽车充电原理讲解中的应用
  • Wan2.2-T2V-A14B助力科研团队展示复杂实验流程
  • WarcraftHelper:魔兽争霸III终极优化插件完整指南
  • 完整指南:打造个性化Android手机桌面的开源应用合集
  • traceroute 使用详解
  • 低成本高效率:Wan2.2-T2V-5B如何实现实时视频生成?
  • Wan2.2-T2V-A14B实现天气变化与环境交互的真实模拟
  • SpringBoot3自定义配置实战指南
  • 40、《GNU 宽通用公共许可证(LGPL)2.1 版解读》
  • 什么是护网?2024护网行动怎么参加?一文详解_护网具体是做啥的
  • Wan2.2-T2V-A14B生成风格化视频的能力评测:动漫/水墨/油画
  • 终极指南:如何从零开始定制化编译DeepVariant源码
  • DuiLib_Ultimate终极完整免费指南:零基础构建Windows桌面应用