[Ecosystem] enable saving and loading FP8 model(#53) #1683

xin3he · 2025-01-08T02:01:32Z

What does this PR do?

Fixes # (issue)

Before submitting

This PR fixes a typo or improves the docs (you can dismiss the other checks if that's the case).
Did you make sure to update the documentation with your changes?
Did you write any new necessary tests?

yafshar · 2025-01-08T23:00:53Z

@xin3he Could you please remove 'software ticket' and 'OHF' from the title? This PR is for OH

examples/text-generation/README.md

yafshar · 2025-01-09T19:10:51Z

@xin3he can you please address the comments. everything else sounds good to me!

Co-authored-by: Yaser Afshar <[email protected]>

xin3he · 2025-01-13T03:04:51Z

Surely, thank you @yafshar, sorry for the delay response.

Signed-off-by: Xin He <[email protected]>

yafshar

LGTM!

Hi @regisss, this PR is ready for your final review. Could you please take a look?

examples/text-generation/README.md

xin3he · 2025-01-17T02:06:04Z

A reminder of TODO:

We need to add multi-cards saving and loading after this bug fix is merged into Habana software. Support pure meta model lm_head tp deepspeedai/DeepSpeed#6812.
Will remove maxabs_quant_const_scales.json after PR is merged into Habana software. https://github.com/habana-internal/neural-compressor-fork/pull/6

May happen in v1.20.0.

examples/text-generation/run_generation.py

examples/text-generation/README.md

Co-authored-by: regisss <[email protected]>

examples/text-generation/README.md

Signed-off-by: Xin He <[email protected]>

Co-authored-by: regisss <[email protected]>

Signed-off-by: Xin He <[email protected]>

xin3he · 2025-02-07T03:46:18Z

A reminder of TODO:

We need to add multi-cards saving and loading after this bug fix is merged into Habana software. Support pure meta model lm_head tp deepspeedai/DeepSpeed#6812.

Will remove maxabs_quant_const_scales.json after PR is merged into Habana software. [SW-205970] update state_dict to save scalar scales habana-internal/neural-compressor-fork#6

May happen in v1.20.0.

@regisss, since PRs mentioned above are all merged, I updated this PR for 1.20.0.

[SW-211858] [Ecosystem] enable saving and loading FP8 model in OHF (#53)

eae4688

xin3he requested a review from regisss as a code owner January 8, 2025 02:01

yafshar reviewed Jan 8, 2025

View reviewed changes

examples/text-generation/README.md Outdated Show resolved Hide resolved

yafshar reviewed Jan 8, 2025

View reviewed changes

examples/text-generation/README.md Outdated Show resolved Hide resolved

yafshar reviewed Jan 8, 2025

View reviewed changes

examples/text-generation/README.md Outdated Show resolved Hide resolved

yafshar reviewed Jan 8, 2025

View reviewed changes

examples/text-generation/README.md Outdated Show resolved Hide resolved

yafshar reviewed Jan 8, 2025

View reviewed changes

examples/text-generation/README.md Outdated Show resolved Hide resolved

yafshar reviewed Jan 8, 2025

View reviewed changes

examples/text-generation/README.md Outdated Show resolved Hide resolved

yafshar reviewed Jan 8, 2025

View reviewed changes

examples/text-generation/README.md Outdated Show resolved Hide resolved

yafshar reviewed Jan 9, 2025

View reviewed changes

examples/text-generation/README.md Show resolved Hide resolved

xin3he changed the title ~~[SW-211858] [Ecosystem] enable saving and loading FP8 model in OHF (#53)~~ [Ecosystem] enable saving and loading FP8 model(#53) Jan 13, 2025

xin3he and others added 7 commits January 13, 2025 11:01

Update examples/text-generation/README.md

2348030

Co-authored-by: Yaser Afshar <[email protected]>

Update examples/text-generation/README.md

df4fc16

Co-authored-by: Yaser Afshar <[email protected]>

Update examples/text-generation/README.md

fbbabd7

Co-authored-by: Yaser Afshar <[email protected]>

Update examples/text-generation/README.md

35d0a86

Co-authored-by: Yaser Afshar <[email protected]>

Update examples/text-generation/README.md

db0832f

Co-authored-by: Yaser Afshar <[email protected]>

Update examples/text-generation/README.md

8a2fcee

Co-authored-by: Yaser Afshar <[email protected]>

Update examples/text-generation/README.md

f2cf26b

Co-authored-by: Yaser Afshar <[email protected]>

workaround for 1.19.0 Synapse

512a225

Signed-off-by: Xin He <[email protected]>

yafshar approved these changes Jan 14, 2025

View reviewed changes

libinta reviewed Jan 16, 2025

View reviewed changes

examples/text-generation/README.md Outdated Show resolved Hide resolved

libinta reviewed Jan 16, 2025

View reviewed changes

examples/text-generation/README.md Show resolved Hide resolved

libinta reviewed Jan 16, 2025

View reviewed changes

examples/text-generation/README.md Outdated Show resolved Hide resolved

Update README.md

f185190

regisss reviewed Jan 21, 2025

View reviewed changes

examples/text-generation/run_generation.py Outdated Show resolved Hide resolved

examples/text-generation/README.md Outdated Show resolved Hide resolved

Update examples/text-generation/README.md

aef88f0

Co-authored-by: regisss <[email protected]>

xin3he added 2 commits January 26, 2025 12:44

Update run_generation.py

132535f

Merge branch 'main' into auto-pr-5999a1a

9853947

regisss reviewed Jan 30, 2025

View reviewed changes

examples/text-generation/README.md Outdated Show resolved Hide resolved

examples/text-generation/README.md Show resolved Hide resolved

xinhe3 and others added 3 commits February 7, 2025 05:14

update for 1.20.0 release

e85c755

Signed-off-by: Xin He <[email protected]>

Update examples/text-generation/README.md

284fbbb

Co-authored-by: regisss <[email protected]>

update readme

0b9db12

Signed-off-by: Xin He <[email protected]>

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

[Ecosystem] enable saving and loading FP8 model(#53) #1683

[Ecosystem] enable saving and loading FP8 model(#53) #1683

xin3he commented Jan 8, 2025

yafshar commented Jan 8, 2025

yafshar commented Jan 9, 2025

xin3he commented Jan 13, 2025

yafshar left a comment

xin3he commented Jan 17, 2025 •

edited

Loading

xin3he commented Feb 7, 2025 •

edited

Loading

[Ecosystem] enable saving and loading FP8 model(#53) #1683

Are you sure you want to change the base?

[Ecosystem] enable saving and loading FP8 model(#53) #1683

Conversation

xin3he commented Jan 8, 2025

What does this PR do?

Before submitting

yafshar commented Jan 8, 2025

yafshar commented Jan 9, 2025

xin3he commented Jan 13, 2025

yafshar left a comment

Choose a reason for hiding this comment

xin3he commented Jan 17, 2025 • edited Loading

xin3he commented Feb 7, 2025 • edited Loading

xin3he commented Jan 17, 2025 •

edited

Loading

xin3he commented Feb 7, 2025 •

edited

Loading