Sengxian
|
4f5910ccd2
Merge branch 'batch-generation' of github.com:duzx16/GLM-130B
|
vor 3 Jahren |
Sengxian
|
a361c5c843
Update quantization results
|
vor 3 Jahren |
Aohan Zeng
|
0bdb6d2a92
Merge pull request #22 from THUDM/quantization
|
vor 3 Jahren |
Sengxian
|
96623d7cbc
Merge branch 'quantization' of github.com:THUDM/GLM-130B into quantization
|
vor 3 Jahren |
Sengxian
|
00f6ea61a3
Merge remote-tracking branch 'origin/main' into quantization
|
vor 3 Jahren |
Shaw
|
0daf7051fc
Update quantization.md
|
vor 3 Jahren |
Shaw
|
d405d89c87
Update README.md
|
vor 3 Jahren |
Sengxian
|
28e449b79f
Update quantization docs and scripts
|
vor 3 Jahren |
Sengxian
|
6b410ef9d2
Add checkpoint tensor parallel conversion script
|
vor 3 Jahren |
Zhengxiao Du
|
7be5ba1758
Fix finalize in BeamSearchStrategy
|
vor 3 Jahren |
Zhengxiao Du
|
3bb0f456d1
Fix top_p argument in generate.py
|
vor 3 Jahren |
Zhengxiao Du
|
1241f03ec2
Fix sampling in BaseStrategy
|
vor 3 Jahren |
Shaw
|
a7a1bfb806
Update README.md
|
vor 3 Jahren |
Shaw
|
4c5be1093d
Create README.md
|
vor 3 Jahren |
Zhengxiao Du
|
26543554f8
Remove redundant imports
|
vor 3 Jahren |
Zhengxiao Du
|
10677a8dc2
Fix consider_end
|
vor 3 Jahren |
Zhengxiao Du
|
e7d58c7d9d
Fix generate.py
|
vor 3 Jahren |
Sengxian
|
113f5f1364
Add language modeling task
|
vor 3 Jahren |
Sengxian
|
c64d6ea33c
Fix quantization argument bug
|
vor 3 Jahren |
Zhengxiao Du
|
223c40b636
Fix BeamSeachStartegy
|
vor 3 Jahren |
Sengxian
|
21cadf7677
Add load from quantized checkpoint
|
vor 3 Jahren |
Zhengxiao Du
|
bb9fbe4bfc
Implement batch generation
|
vor 3 Jahren |
Sengxian
|
96eac9f33b
Add 4-bit quantization and CUDA kernels
|
vor 3 Jahren |
Sengxian
|
e10b098020
Add 8-bit quantization
|
vor 3 Jahren |
Shaw
|
5b1b0bf8ca
Update README_zh.md
|
vor 3 Jahren |
Aohan Zeng
|
a8a1d5818b
Merge pull request #7 from erjanmx/fix-readme-typo
|
vor 3 Jahren |
Erjan Kalybek
|
738695c6c9
Fix readme typo
|
vor 3 Jahren |
Shaw
|
11befcbf80
Fix script name in README
|
vor 3 Jahren |
xiao9905
|
22d1a03c3e
Merge branch 'main' of github.com:THUDM/GLM-130B into main
|
vor 3 Jahren |
xiao9905
|
964695129f
update English version of the training logs
|
vor 3 Jahren |