python-L4_work

本文介绍了一个使用Python实现的自定义向量类,该类支持基本的向量操作如加法、乘法及点积运算。通过ctypes模块创建数组以存储向量元素,并实现了向量间的各种数学运算。

http://f.dataguru.cn/thread-674423-1-1.html


import ctypes

import random


class Array(object):
    def __init__(self, size):
        """
        用传入的大小参数创建一个数组
        :param size: int
        """
        assert size > 0, "数组必须大于0"
        self._size = size
        # 用ctypes模块创建数组
        py_array_type = ctypes.py_object * size
        self._elements = py_array_type()
        # Initialize each element
        self.clear(None)


    def __len__(self):
        """
        返回数组的长度
        :return: int
        """
        return self._size


    def __getitem__(self, index):
        """
        返回索引的元素
        :param index: int
        :return: elements in Array
        """
        assert 0 <= index < len(self), "数组下标越界。"
        return self._elements[index]


    def __setitem__(self, index, value):
        """
        为索引的元素赋值
        :param index: int
        :param value: any type
        """
        assert 0 <= index < len(self), "数组下标越界。"
        self._elements[index] = value


    def clear(self, value):
        """
        将数组的每个元素设置为给定的值
        :param value: any type
        """
        for i in range(len(self)):
            self._elements[i] = value


    def __iter__(self):
        """
        返回数组的迭代器
        :return: iter
        """
        return _ArrayIterator(self._elements)


    def __str__(self):
        """
        返回可打印数据
        :return: str
        """
        return str([element for element in self._elements])




class _ArrayIterator(object):
    # 初始化类,下标指向第一位
    def __init__(self, the_array):
        """
        数组的迭代器类
        :param the_array: Array
        """
        self._arrayRef = the_array
        self._curNdx = 0


    def __iter__(self):
        """
        返回迭代器本身
        :return: iter
        """
        return self


    # 下标没有越界,返回对应元素,下标+1;下标越界,抛出StopIteration异常
    def next(self):
        """
        迭代器的next实现
        :return: element of Array
        """
        if self._curNdx < len(self._arrayRef):
            entry = self._arrayRef[self._curNdx]
            self._curNdx += 1
            return entry
        else:
            raise StopIteration




class Vector(Array):
    def __add__(self, other):
        """
        向量加法,如果其中一个是int或float型,将向量的每一个元素与其相加,如果两个是Vector型,将两个向量中对应的元素相加
        :param other: Vector or int or float
        :return: Vector
        """
        # 创建一个Vector类型的tmp变量
        tmp = Vector(len(self))
        # 判断other是否是int或float型
        if isinstance(other, int) or isinstance(other, float):
            # 将向量中每一个元素都加上other
            for i in range(len(self)):
                tmp[i] = self._elements[i] + other
        # 判断other是否是Vector型
        elif isinstance(other, Vector):
            assert len(self) == len(other), '向量长度不相等'
            # 将向量中每一个元素与other中对应元素相加
            for i in range(len(self)):
                tmp[i] = self._elements[i] + other[i]
        # 如果other是其他类型,发起TypeError异常
        else:
            raise TypeError


        return tmp


    def __mul__(self, other):
        """
        向量乘法,如果其中一个是int或float型,将向量的每一个元素与其相乘,如果两个是Vector型,将两个向量中对应的元素相乘
        :param other: Vector or int or float
        :return: Vector
        """
        tmp = Vector(len(self))
        if isinstance(other, int) or isinstance(other, float):
            for i in range(len(self)):
                tmp[i] = self._elements[i] * other


        elif isinstance(other, Vector):
            assert len(self) == len(other), '向量长度不相等'
            for i in range(len(self)):
                tmp[i] = self._elements[i] * other[i]
        # 如果other是其他类型,发起TypeError异常
        else:
            raise TypeError
        return tmp


    def dot(self, other):
        """
        计算向量点积,将两个向量对应元素相乘,并将结果相加
        :param other: Vector
        :return: Vector
        """
        assert isinstance(other, Vector), '传入参数非Vector类型'
        assert len(self) == len(other), '向量长度不相等'
        sums = 0
        for x, y in zip(self, other):
            sums += x * y


        return sums




if __name__ == '__main__':
    x1 = Vector(4)
    x1[0] = 1
    x1[1] = 2
    x1[2] = 3
    x1[3] = 4


    x2 = Vector(4)
    x2[0] = 1
    x2[1] = 2
    x2[2] = 3
    x2[3] = 4


    print x1 + 4.5
    print x1 + x2
    print x1 * 3.4
    print x1 * x2


    print x1.dot(x2)
### Pandas 文件格式读写操作教程 #### 1. CSV文件的读取与保存 Pandas 提供了 `read_csv` 方法用于从 CSV 文件中加载数据到 DataFrame 中。同样,也可以使用 `to_csv` 将 DataFrame 数据保存为 CSV 文件。 以下是具体的代码示例: ```python import pandas as pd # 读取CSV文件 df = pd.read_csv('file.csv') # 加载本地CSV文件 [^1] # 保存DataFrame为CSV文件 df.to_csv('output.csv', index=False) # 不保存行索引 [^1] ``` --- #### 2. JSON文件的读取与保存 对于JSON格式的数据,Pandas 支持通过 `read_json` 和 `to_json` 进行读取和存储。无论是本地文件还是远程 URL 都支持。 具体实现如下所示: ```python # 读取本地JSON文件 df = pd.read_json('data.json') # 自动解析为DataFrame对象 [^3] # 从URL读取JSON数据 url = 'https://example.com/data.json' df_url = pd.read_json(url) # 直接从网络地址获取数据 # 保存DataFrame为JSON文件 df.to_json('output.json', orient='records') ``` --- #### 3. Excel文件的读取与保存 针对Excel文件操作Pandas 使用 `read_excel` 来读取 `.xls` 或 `.xlsx` 格式的文件,并提供 `to_excel` 方法导出数据至 Excel 表格。 注意:需要安装额外依赖库 `openpyxl` 或 `xlrd` 才能正常运行这些功能。 ```python # 安装必要模块 (如果尚未安装) !pip install openpyxl xlrd # 读取Excel文件 df_excel = pd.read_excel('file.xlsx', sheet_name='Sheet1') # 导出DataFrame为Excel文件 df.to_excel('output.xlsx', sheet_name='Sheet1', index=False) ``` --- #### 4. SQL数据库的交互 当涉及关系型数据库时,Pandas 可借助 SQLAlchemy 库连接各种类型的数据库(如 SQLite, MySQL)。它允许直接查询并将结果作为 DataFrame 返回;或者反过来把现有 DataFrame 插入到指定表中。 下面是基于SQLite的一个例子: ```python from sqlalchemy import create_engine # 创建引擎实例 engine = create_engine('sqlite:///database.db') # 查询SQL语句并返回DataFrame query = "SELECT name, salary, department FROM employees" sql_df = pd.read_sql(query, engine) # 计算各部门平均工资 avg_salary_by_dept = sql_df.groupby('department')['salary'].mean() # 将DataFrame存回SQL表 avg_salary_by_dept.to_sql(name='average_salaries_per_department', con=engine, if_exists='replace', index=True) ``` 上述片段说明了如何执行基本SQL命令以及后续数据分析流程[^4]。 --- #### 5. 多层次索引(MultiIndex)的应用场景 除了常规单维度索引外,在某些复杂情况下可能需要用到多级索引结构。这时可以依靠 MultiIndex 构建更加灵活的数据模型。 例如定义一个多层列名体系: ```python arrays = [['A','A','B','B'], ['foo','bar','foo','bar']] tuples = list(zip(*arrays)) index = pd.MultiIndex.from_tuples(tuples, names=['first', 'second']) df_multi_indexed = pd.DataFrame([[0,1,2,3], [4,5,6,7]], columns=index) print(df_multi_indexed) ``` 这段脚本演示了怎样构建一个具有双重分类标签的表格布局[^2]。 --- ### 总结 综上所述,Pandas 是一种强大而易用的数据处理工具包,适用于多种常见文件类型之间的相互转换及其高级特性应用开发之中。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值