nVidia kártya upgrade

enlightened Ez az oldal a közösségért készül. heart Kövess minket máshol is:  Linux Mint Magyar Közösség a Mastodon-on  Telegram csatorna – csak hírek  Beszélgessünk a Telegram – Linux csevegő csoport  Hírek olvasása RSS segítségével  Linux Mint Hivatalos Magyar Közösség a Facebook-on      Linux Mint Baráti Kör a Facebook-on
wink Ha hasznosnak találod, és szeretnéd, hogy folytatódjon, támogasd a munkát Ko-fi vagy Paypal segítségével. laugh

Fórum: 

Sziasztok,

van egy asztali gépem, Linux Mint 21.3 fut rajta. A gépben volt egy GT730-as nVidia videokártya. Kicsivel több, mint 5 éve telepítettem így, azóta volt pár frissítés (talán 19-es Mint-tel kezdtem), és mindig nagyon stabil volt. Ritkán volt restart, csak ha kernel vagy valami egyéb szükséges komponens frissítése szükségessé tette a restartot, többnyire csak hibernáltam a gépet.

Tegnap kicseréltem a videokártyát egy nVidia GTX 1050-re, ill. frissítettem a drivert nvidia-driver-390-ről nvidia-driver-535-re (ez az ajánlott a telepítő szerint).

Azóta ha hibernálásból jön vissza a gép, pár perc után lefagy.

Találkozott már valaki hasonlóval? Ill. van ötlete valakinek, merre induljak, mit nézzek meg?

A kártyát nem akarom visszacserélni, mert úgy tudom, az újabb Mint-ekben újabb kernelek vannak, amik már nem támogatják a régebbi nVidia kártyákat, és jó lenne hamarosan frissíteni.

 

Köszi,

a.

csuhas32 képe

Külső tároló

Értékelés: 

0
Még nincs értékelve

Szia!

Nekem is hasonló videokártyám van és korábban voltak vele gondjaim az alaptárolókból elérhető meghajtókkal.
Aztán felvettem ezt a külső tárolót és bővebb lett a driver-kínálat, így már tudtam olyat választani, amivel számomra megfelelően működik.
Itt a szűrés csak a te jelenlegi rendszered alapjául szolgáló Jammy-re elérhető meghajtókból.
Ugyan én nem szoktam hibernálni és a jelenlegi rendszerem is frissebb mint a tiéd, de ettől függetlenül, ez talán nálad is beválhat.
Én mindig szoktam készíteni rendszer visszaállítási pontot a Thimeshifttel, mielőtt nekiállok NVIDIA meghajtót cserélgetni, ha besül a mutatvány, akár kintről is vissza tudjam állítani a rendszert.

megoldást nem tudok

Értékelés: 

0
Még nincs értékelve

Nem igazán használok Nvidia kártyákat, de:

A régebbi kártyák gyári driverét valóban csak 6.8-as kernel támogatja. Ez azt jelenti, hogy újabb Mint tiszta telepítéssel 6.14-es kernellel cumi. Viszont ha röptében frissíted, akkor marad a 6.8-as kernel. Ez direkt van így, Clem külön kiemelte / benne van a kiadási dokumentációban, akinek régebbi kártyája van, az előbb telepítsen 21-es Mint-et, és arra frissítsen az újabb rendszert.

Most azt javasolnám, nyugodtan engedd fel a 22.x Mint-et, majd telepítsd a Frissítéskezelővel a 6.14-es kernelt. A 6.8-as megmarad, és frissülni fog. Ha vissza kell lépni, akkor Grub-ból tudod indítani a 6.8-as kernelt, és el tudod távolítani a 6.14-et, ha nem jó.

 

Külső tároló

Értékelés: 

0
Még nincs értékelve

#1

Hello,

 

köszi - nem tudtam, hogy van külső tároló, ez mindenképp hasznos lehet. Közben talán sikerült megoldani a problémát, nemsokára leírom, hátha másnak is segítség lesz.

Egyelőre maradok a hivatalos driver-nél.

 

Köszi még egyszer.

megoldást nem tudok

Értékelés: 

0
Még nincs értékelve

#2

Köszi a segítséget.

> A régebbi kártyák gyári driverét valóban csak 6.8-as kernel támogatja. Ez azt jelenti, hogy újabb Mint tiszta telepítéssel 6.14-es kernellel cumi. 

Hátőőő... itt még 5.15.0 van. De igen, értem, mire utalsz.

> Most azt javasolnám, nyugodtan engedd fel a 22.x Mint-et, majd telepítsd a Frissítéskezelővel a 6.14-es kernelt. A 6.8-as megmarad, és frissülni fog. Ha vissza kell lépni, akkor Grub-ból tudod indítani a 6.8-as kernelt, és el tudod távolítani a 6.14-et, ha nem jó.

Mármint az 5.8-as kernelt tudom indítani :).

Egyelőre sikerült elhárítani a hibát, kicsit most használom még így, ha minden ok, akkor frissítek.

 

Köszi még egyszer.

Megoldva

Értékelés: 

5
Átlag: 5 (1 szavazat)

Közben a Gemini-t is faggattam, hogy mi lehet a hiba és hogy lehet elhárítani.

A logok elemzése során talált egy hibát:

NVRM: Xid 31

aminek a jelentése elvileg "GPU Memory Page Fault". Szerinte hibernáláskor a videokártya memóriája nem lett kiírva, és hibernálásból történő visszatéréskor ez okozott gondot.

A megoldás végül ez a három új kernel paraméter lett:

pcie_aspm=off pci=nommconf nouveau.modeset=0

A nouveau.modeset=0 nem kimondottan ehhez kel, az "csak" segít a driverek összeakadásának megelőzésében. Ill a pci=nommconf sem feltétlen ehhez kell, igazából csak a legelső, ami szerinte megoldotta.

Köszi mindenkinek.

Három kérdés:

Értékelés: 

0
Még nincs értékelve

Három kérdés:
1) Megfelelő méretű swap lemezterület be van állítva a rendszernek?
2) Grub-ban hozzá van adva ennek az uuid-je a GRUB_CMDLINE_LINUX_DEFAULT sorhoz?
Például így:
GRUB_CMDLINE_LINUX_DEFAULT="quiet splash resume=UUID=33a22b26-8ea4-438f-bd46-c590ef370f0f"
3) sudo update-grub és sudo update-initramfs -u megvoltak?

Jelenleg 22.3-as Mint (tiszta telepítés volt) alatt az 580-as drivert használom egy 1050Ti kártyával, 6.17-es kernellel és minden flottul működik (hibernálás is!).

22.3-as beállítása ez alapján történt:
https://automatestack.dev/enable-hibernate-mode-on-ubuntu-25-04-plucky-p...

Szerinte hibernáláskor a videokártya memóriája nem lett kiírva, és hibernálásból történő visszatéréskor ez okozott gondot.

...mert nem volt hová. A swap tehát vagy nincs, vagy nincs hozzáadva a grub-hoz. Szerintem.

Három kérdés:

Értékelés: 

0
Még nincs értékelve

#6

Köszi,

> 1) Megfelelő méretű swap lemezterület be van állítva a rendszernek?

Természetesen. Ahogy írtam, 5 éve teljesen fagyásmentesen megy a rendszer. Egyébként hogy számszerűsítsük: 16G RAM van a gépben, és 32G a SWAP.

> 2) Grub-ban hozzá van adva ennek az uuid-je a GRUB_CMDLINE_LINUX_DEFAULT sorhoz?

Természetesen. Ahogy írtam, 5 éven keresztül szinte minden nap hibernáltam, majd másnap abból ébredt a gép.

> 3) sudo update-grub és sudo update-initramfs -u megvoltak?

Természetesen.

> Jelenleg 22.3-as Mint (tiszta telepítés volt) alatt az 580-as drivert használom egy 1050Ti kártyával, 6.17-es kernellel és minden flottul működik (hibernálás is!).

Értem, de itt sajnos 21.3-as Mint van, és bár 19.X-ről indultam, eddig minden frissítés után stabil maradt a rendszer, de most HW váltás volt.

 

 

 

Megoldva

Értékelés: 

0
Még nincs értékelve

#5

Sajnos megint előjött a fagyás.

Érdekes, hogy munka közben egy webrádiót hallgattam, és a stream ment tovább, viszont semmire nem reagált a gép, konzolra (Alt+Ctrl+F3 pl) sem reagált.

A journalctl ezt mutatja:

# journalctl -b -1 -e | grep -i xid

febr 09 08:50:30 basil kernel: NVRM: Xid (PCI:0000:01:00): 32, pid=177, name=systemd-udevd, Channel ID 00000000 intr 00008000

(Tegnap Xid 31 volt a hibakód, most 32...)

Egyéb ötlet?

kami911 képe

Érdekes probléma, amit kernel

Értékelés: 

0
Még nincs értékelve

Érdekes probléma, amit kernel szinten beállítottál, az jó,  máshol is olvastam. Mi lenne ha későbbi nvidia illesztőprogramot próbálnál ki? Akár az 580-as is megfelelő lehet, ahogy néztem az támogatja a 5.x kerneleket is. Az újabb (590) főverziók már nem támogatják a GTX 10xx-es kárytákat. Lehet esetleg újabb kernelt is érdemes lenne próbálni,  ha csak nem direkt vagy ennél a régivel. 

nvidia-smi -q nem ad esetleg további információt a hibáról?

Amit lehet még esetleg:
– BIOS frissítés

– IOMMU kikapcsolása kernelparaméterrel vagy BIOS-ból
– BIOS-ban „PCIe Gen3 fix” beállítás automata helyett

 

https://docs.nvidia.com/deploy/xid-errors/analyzing-xid-catalog.html

https://docs.nvidia.com/deploy/xid-errors/working-with-xid-errors.html

Érdekes probléma, amit kernel

Értékelés: 

0
Még nincs értékelve

#9

> Mi lenne ha későbbi nvidia illesztőprogramot próbálnál ki? Akár az 580-as is megfelelő lehet, ahogy néztem az támogatja a 5.x kerneleket is.

Igazából ez volt a topic nyitásának a lényege, hogy kinek milyen tapasztalata van, érdemes-e másik modullal megpróbálni.

Tegnap jött kernel frissítés, így este ismét leállítottam a gépet, reggel clean boot volt. Kipróbáltam a hibernálást, de ismét volt egy xid hiba:

febr 10 08:27:05 basil kernel: NVRM: Xid (PCI:0000:01:00): 31, pid=179, name=systemd-udevd, Ch 00000000, intr 10000000. MMU Fault: ENGINE HOST6 HUBCLIENT_HOST faulted @ 0x20_646e7000. Fault is of type FAULT_PDE ACCESS_TYPE_READ

szóval még hangoltam (most bekerült az nvidia.NVreg_EnableMSI=1).

Nem tudom, hogy a 21.3-as Minthez van-e újabb kernel az 5.15-nél (biztos van külső tároló), a tervezett frissítés valszeg meghozná azt is.

BIOS-t nem nagyon akarok frissíteni - ill. relatíve régi az alaplap, nem tudom, van-e még hozzá frissítés (Gigabit Z270).

> – IOMMU kikapcsolása kernelparaméterrel vagy BIOS-ból
> – BIOS-ban „PCIe Gen3 fix” beállítás automata helyett

Az IOMMU most lazy mode, egyelőre nem piszkálom, holnap reggel meglátom, van-e még Xid hiba a boot-kor.

A PCIe most 8GT/s-en van az lspci szerint, ez elvileg Gen3, de nem biztos, hogy fix, lehet, hogy auto. Most nem akarom piszkálni, de a köv. fagyásnál (vagy hibernálás utáni Xid hiba esetén) megnézem.

Köszi mindent.

 

 

Kicsit félve írom

Értékelés: 

0
Még nincs értékelve

#10

Kicsit félve írom még, de talán a kernel upgrade megoldotta a problémát.

Mivel bármilyen hangolással (kernel cmdline argumentumok, nvidia modul opciók) folyamatosan előjött valamilyen `Xid` hiba (jellemzően a 31-es), vagy sikertelen volt a hibernálás utáni boot, megpróbáltam a 21.3-hoz letölthető `linux-generic-hwe-22.04`-es kernelt.

A jelenlegi uptime 2 nap és 1 óra, ill kb az 5. élesztés volt hibernálásból, egyelőre `Xid` hiba nélkül, és a rendszer is elég stabil, nem volt semmi fagyás.

Melyik kernelre álltál?

Értékelés: 

0
Még nincs értékelve

#12

Bocs, ez valóban pongyola volt.

# uname -a
Linux basil 6.8.0-94-generic #96~22.04.1-Ubuntu SMP PREEMPT_DYNAMIC Fri Jan 16 13:19:05 UTC 2 x86_64 x86_64 x86_64 GNU/Linux

Melyik kernelre álltál?

Értékelés: 

0
Még nincs értékelve

#13 Én erről beszéltem, amikor 6.8-ról beszéltem. Most csak arra kell figyelni, hogy 6.14-es ne kerüljön fel, de ha röotében frissítesz 22.3-ra, akkor ez megmarad.

Melyik kernelre álltál?

Értékelés: 

0
Még nincs értékelve

#14

Ezt akkor se nagyon értettem, és most sem értem pontosan. Ezt írtad:

> A régebbi kártyák gyári driverét valóban csak 6.8-as kernel támogatja. Ez azt jelenti, hogy újabb Mint tiszta telepítéssel 6.14-es kernellel cumi.

A "régi kártya" a GT730-as volt, az "új" a GTX 1050-es.

Mikor azt írtad, azt hittem arra gondolsz, hogy ha maradt volna a régi kártya, akkor a frissítés bukó.

Ahogy írtam a nyitó posztban, 21.3-as Mintem van. Most próbáltam kideríteni, hogy itt mi az alapértelmezett kernel, de nekem még 5.15 volt, és ezzel működött jól a GT730, és nem ment a hibernálásból visszaélesztés a GTX1050-nel. Lehet, hogy az 5.15 "itt maradt" egy korábbi verzióból, de más kernelt nem látok, így nem hiszem, hogy ez valami maradvány lenne itt.

Ha a "régebbi kártya" alatt a GT730-at érted, akkor szerintem félreértetted a helyzetet, mert nekem "újabb" kártyám van - ami most egy újabb kártyával működik, immár több, 3 napja, és kb 6-7 hibernálásból történő felébresztés után (mármint a 6.8-as kernellel).

Valahol azt olvastam, - és szerintem te erre gondoltál - hogy a régi kártyákat valóban csak a 6.8-as kernelig támogatja a Linux, de én pont amiatt cseréltem a kártyát, hogy tudjak frissíteni. Ott azt írták, hogy a 1050-es már megy a 22.X-es Mint alatt is.

 

 

Melyik kernelre álltál?

Értékelés: 

0
Még nincs értékelve

#15

21.-nál még 5. akármi kernel.

22. Valamikor 6.8  bejött, Edge emiatt megszűnt

22.3 már 6.14 kernel, ami már rendszermag, ami már régi Nvidia kártyákkal nem jó.

Röptében frissítve megmarad az elöző kernel.

Újonnan feltéve a 22.3-at 6.14 rendszermag lesz, ez vízválasztó az Nvidia kártyánál. Mert ezen a régi driver nem megy, az új driver még nem támogat csak új kártyákat.

Ennyit akartam mondani, az, hogy melyik régi vagy új, mitől számít réginek melyik kártya, nem tudom, mert nem használok ilyen kártyákat.