#
Git
Press
Login
Tag
#
Python
Tagged
Posts
sh16ma
published in
📦 INBOX
@ 2024/02/10
【線形代数】線形代数とは
線形代数 (Linear Algebra)線型空間と線型変換を中心とした理論を研究する代数学の一分野。 もう少し噛み砕いた言い方だと、行列の性質や扱い方を考えた学問と捉えても問題ない。基本的な線形代数は、機械学習を学ぶ際の必要最低限の知識。 機械学習では、PandasやNumpyで、データセット前処理として行列の演算などを行う。その際に「行列」の基本的な役割や扱い方の知識が必要。
Chihwei-Hsu
@ 2017/07/31
2017-7-31 python set 交集、并集、差集
example:valid = set(['yellow', 'red', 'blue', 'green', 'black'])input_set = set(['red', 'brown'])
Chihwei-Hsu
@ 2017/07/31
2017-7-31 python 生成器(Generators)
能提供迭代器的任意对象;只要定义了一个迭代器的iter方法或定义了支持下标索引的getitem方法,那就是一个可迭代对象。任意对象,只要定义了next或者next方法,那就是一个迭代器从某个地方(如列表)取出一个元素的过程;使用一个循环来遍历某个东西(如列表),这个过程就是迭代;
Chihwei-Hsu
@ 2017/08/01
2017-8-1 python rrule bug
http://dateutil.readthedocs.io/en/stable/_modules/dateutil/rrule.htmlPer RFC section 3.3.10, recurrence instances falling on invalid dates and times are ignored rather than coerced:Recurrence rules may generate recurrence instances with an invalid date (e.g., February 30) or nonexistent local time (e.g., 1:30 AM on a day where the local time is moved forward by an hour at 1:00 AM).
Chihwei-Hsu
@ 2017/08/10
2017-8-10 string 去掉标点符号
str.isalnum:S.isalnum() -> boolReturn True if all characters in S are alphanumeric and there is at least one character in S, False otherwise.
Chihwei-Hsu
@ 2017/08/10
2017-8-10 调试 Pdb(Python debugger)
python -m pdb my_script.py<!--more--> import pdb
Chihwei-Hsu
@ 2017/08/13
2017-8-13 三元表达式(条件表达式)
使用一行代码快速判断,替换复杂的多行if语句,使得代码简单可维护。condition_is_true if condition else condition_is_falseis_fat = True
Chihwei-Hsu
@ 2017/08/14
2017-8-14 JSON文件 读写 格式化
indent: 缩进(一般填4,缩进4格);sort_keys: 是否排序(默认False--不排序)def write_info(file_name, file_info):
Chihwei-Hsu
@ 2017/08/23
2017-8-23 mongo insert_many BulkWriteError
在对mongo插入数据时,报写入问题,报错信息如下:Traceback (most recent call last):File "/root/crs/call_history_crawler/worker/communicate.py", line 149, in insert_db_data
Chihwei-Hsu
@ 2017/08/27
2017-8-27 dataframe与序列相乘
继续完成项目中的评分卡部分,拿到分好箱的数据后,如何进行加权得到最后的分数就是我们接下来要考虑的问题了。<!--more--> result = dataframe.mul(series, axis=0)
Chihwei-Hsu
@ 2017/08/27
2017-8-27 Pandas 分箱操作(cut)
最新,项目中涉及到评分卡操作,评分项目有大概几十项,每项基本都是按频次区间给一个分数,最后,累计所有项目的分数得出最后所需要的分数。<!--more--> import pandas as pd
Chihwei-Hsu
@ 2017/08/27
2017-8-27 python 协程加速
上周,由于产品嫌报告生成太慢,经过使用profile/gprof2dot研究后,发现主要时间耗费在接口网络请求上,于是我决定在项目中大量处理I/O网络请求的地方使用gevent,以缓解报告生成压力。<!--more--> import gevent
Chihwei-Hsu
@ 2017/08/28
2017-8-28 Pandas agg 使用lambda
import numpy as npimport pandas as pdN = 100
Chihwei-Hsu
@ 2017/08/28
2017-8-28 python interval 区间处理
volume1 = Interval.between("A", "Foe")volume2 = Interval.between("Fog", "McAfee")volume3 = Interval.between("McDonalds", "Space")
Chihwei-Hsu
@ 2017/08/31
2017-8-31 python two sum 问题
来自LeetCode
Chihwei-Hsu
@ 2017/08/31
2017-8-31 自动 生成注释文档(docstring)
项目中,发现很多函数、类没有注释说明,一个个弄比较繁琐,所以……<!--more--> 官方:A docstring is a string literal that occurs as the first statement in a module, function, class, or method definition. Such a docstring becomes the doc special attribute of that object;
Chihwei-Hsu
@ 2017/08/06
2017-8-6 python string
n = '4'n.zfill(3)'004'
Chihwei-Hsu
@ 2017/08/07
2017-8-7 pandas 获取不符合条件的dataframe
问题来源:做项目时,想拿到不符合条件的所有数据,比如:通话类型有好多种(主叫、被叫、呼转……),现在想分析所有非主叫数据,那么问题就来了。<!--more--> df = pd.DataFrame({"A": ["Hello", "this", "World", "apple"]})
Chihwei-Hsu
@ 2017/08/07
2017-8-7 python args and kwargs
传递一个非键值对的可变数量的参数列表给一个函数。def test_var_args(f_arg, *argv):print("first normal arg:", f_arg)
Chihwei-Hsu
@ 2017/08/08
2017-8-8 profile cProfile 效率分析
import osimport sysdef process(filename):
Chihwei-Hsu
@ 2017/08/09
Map、Filter、Reduce
将一个函数映射到一个输入列表的所有元素上。items = [1, 2, 3, 4, 5]squared = list(map(lambda x: x**2, items))
Chihwei-Hsu
@ 2017/09/12
2017-9-12 str() vs json.dumps()
<!--more--> data = {'jsonKey': 'jsonValue',"title": "hello world"}
Chihwei-Hsu
@ 2017/09/14
2017-9-14 通过__slots__节省内存
<!--more--> 见原文class Measurement:
Chihwei-Hsu
@ 2017/09/28
2017-9-28 Python 编码之禅
平时工作中经常碰到编码、解码、乱码……类似的问题不胜其烦,如街边小广告一般异常讨厌,需要花时间好好整理一番,“一”绝后患。<!--more--> str(s)与unicode(s)
Chihwei-Hsu
@ 2017/09/05
2017-9-5 python list 排序 sort、sorted
项目中,有一个list,list内部组成元素为dict,现需要根据dict中某个键的值来进行排序。<!-- more --> reverse: False--默认,正序;True--逆序,由大到小;
Chihwei-Hsu
@ 2017/09/05
2017-9-5 计算体脂率
用来计算一个人的体脂率<!--more--> def get_BFR(weight, height, age, gender):
Chihwei-Hsu
@ 2017/09/07
2017-9-7 机器学习分类
<!--more-->
Chihwei-Hsu
@ 2017/09/07
2017-9-7 机器学习路线
编程语言:Python,C++,Spark(大数据环境下);知识储备:英语、线性代数、概率论、图论、神经科学。<!--more-->
Chihwei-Hsu
@ 2017/10/16
2017-10-16 The unit test and mock in python
<!--more--> class Count():
Chihwei-Hsu
@ 2017/05/15
2017-5-15 pandas-入门
Series: 类似于一维数组的对象;索引(index)在左,数据(value)在右,索引自动创建DataFrame: 一种表格型数据结构;二维结构,每列可以存不同类型的值,索引包含行索引及列索引import pandas as pd
Chihwei-Hsu
@ 2017/05/15
2017-5-15 数据分析 入门
D: Data 数据 原始素材I: Information 信息 加工处理后有逻辑的数据K: Knowledge 知识 提炼信息之间的联系,行动的能力,完成当下任务
Chihwei-Hsu
@ 2017/05/16
2017-5-16 从字典中提取子集
给你一个条件,从已给字典中构造一个符合条件的新字典,为原字典的子集。使用字典推导式:prices = {
Chihwei-Hsu
@ 2017/05/23
2017-5-23 一个逗号(,)引起的BUG
昨天工作,突然发现之前好好的list,在赋值给新变量后居然类型变了,一个好好的list几分钟不见妥妥的叛变了,变成了tuple,由此,一场闹剧开始上演...<!-- more --> 话说有一个类对象内有一方法如下:
DeeJay_Y
@ 2018/06/12
Python中值得关注的一些知识点
Python中值得关注的一些知识点<!--more--> 先来看一个例子:
DeeJay_Y
@ 2018/06/10
Python中关于字典的一些API
Python中关于字典的一些API<!--more--> obj = {
DeeJay_Y
@ 2018/06/09
Python中列表(dict)和元祖(tuple)的相关操作
Python中列表(dict)和元祖(tuple)的相关操作<!--more--> 有指定列表lang = ['JavaScript', 'Python', 'Ruby']
DeeJay_Y
@ 2018/06/09
Python中字符串的常见操作
Python中字符串的常见操作<!--more--> 先来了解切片操作:
DeeJay_Y
@ 2018/06/09
Python中的__new__(cls)-以及-单例模式
Python中的new(cls)-以及-单例模式<!--more--> __new__(cls)必须要有一个参数cls,代表着要实例化的类,而且必须要有返回值,返回实例化出来的实例对象.
DeeJay_Y
@ 2018/06/09
Python中的set类型-以及-数组去重问题
Python中的set类型-以及-数组去重问题<!--more--> Pyhton还有一种新的类型叫set, set中不可以有相同的元素:
DeeJay_Y
@ 2018/06/09
Python中的函数
Python中的函数<!--more--> def sayHi():
DeeJay_Y
@ 2018/06/09
Python中的列表生成式
Python中的列表生成式<!--more--> 抛出一个问题,创建一个从1到100的列表,该怎么写:
DeeJay_Y
@ 2018/06/09
Python中的可变类型,不可变类型,以及变量引用
Python中的可变类型,不可变类型,以及变量引用<!--more--> 即一旦定义不支持修改的类型,在Py中,Number,String以及tuple是不可变类型。
DeeJay_Y
@ 2018/06/09
Python中的异常处理
Python中的异常处理<!--more--> 先来看一个最简单的异常,输出一个没有定义的变量:
DeeJay_Y
@ 2018/06/09
Python中的文件操作
Python中的文件操作<!--more--> 一般操作文件的流程都很简单:
DeeJay_Y
@ 2018/06/09
Python中的模块
Python中的模块<!--more--> 一个py文件就是一个模块
DeeJay_Y
@ 2018/06/09
Python中的浅拷贝和深拷贝
Python中的浅拷贝和深拷贝<!--more--> Python中的浅拷贝分为直接赋值和使用copy模块的copy方法来进行浅拷贝。
DeeJay_Y
@ 2018/06/09
Python中的真假值
Python中的真假值<!--more--> 动态转换为False的值有: '', None , 0 , () ,[] , {} .
DeeJay_Y
@ 2018/06/09
Python中的面向对象
Python中的面向对象<!--more-->