Recent Posts

[MLC-机器学习编译]03 张量程序实践

less than 1 minute read

official notes (English) 笔记 首先对上节课一些没有详细介绍的概念给出解释: block: 用于计算单元. axis: [block_axis] = T.axis.[axis_type...

[NVIDIA CUDA编程教程]07 CUDA编程(1)

1 minute read

笔记 CUDA术语: Host主机端, 通常指CPU, Device设备端, 通常指GPU, 强调区分两者主要是因为目前物理存储仍然不同. Kernel指GPU上数据并行处理的函数. Grid指一维/二维线程块(block). ...

[MLC-机器学习编译]02 张量程序抽象

less than 1 minute read

official notes (中文) 笔记 本章以向量相加为例介绍了如何表示张量程序的抽象, 如何对张量函数进行变换/优化, 如何将抽象转化为可执行的函数. 视频21:30处的例子是错的, 原式调换循环等价, 具体见 https://github.com/mlc-ai/ml...