nVidia kártya upgrade

enlightened Ez az oldal a közösségért készül. heart Kövess minket máshol is:  Linux Mint Magyar Közösség a Mastodon-on  Telegram csatorna – csak hírek  Beszélgessünk a Telegram – Linux csevegő csoport  Hírek olvasása RSS segítségével  Linux Mint Hivatalos Magyar Közösség a Facebook-on      Linux Mint Baráti Kör a Facebook-on
wink Ha hasznosnak találod, és szeretnéd, hogy folytatódjon, támogasd a munkát Ko-fi vagy Paypal segítségével. laugh

Fórum: 

Sziasztok,

van egy asztali gépem, Linux Mint 21.3 fut rajta. A gépben volt egy GT730-as nVidia videokártya. Kicsivel több, mint 5 éve telepítettem így, azóta volt pár frissítés (talán 19-es Mint-tel kezdtem), és mindig nagyon stabil volt. Ritkán volt restart, csak ha kernel vagy valami egyéb szükséges komponens frissítése szükségessé tette a restartot, többnyire csak hibernáltam a gépet.

Tegnap kicseréltem a videokártyát egy nVidia GTX 1050-re, ill. frissítettem a drivert nvidia-driver-390-ről nvidia-driver-535-re (ez az ajánlott a telepítő szerint).

Azóta ha hibernálásból jön vissza a gép, pár perc után lefagy.

Találkozott már valaki hasonlóval? Ill. van ötlete valakinek, merre induljak, mit nézzek meg?

A kártyát nem akarom visszacserélni, mert úgy tudom, az újabb Mint-ekben újabb kernelek vannak, amik már nem támogatják a régebbi nVidia kártyákat, és jó lenne hamarosan frissíteni.

 

Köszi,

a.

csuhas32 képe

Külső tároló

Értékelés: 

0
Még nincs értékelve

Szia!

Nekem is hasonló videokártyám van és korábban voltak vele gondjaim az alaptárolókból elérhető meghajtókkal.
Aztán felvettem ezt a külső tárolót és bővebb lett a driver-kínálat, így már tudtam olyat választani, amivel számomra megfelelően működik.
Itt a szűrés csak a te jelenlegi rendszered alapjául szolgáló Jammy-re elérhető meghajtókból.
Ugyan én nem szoktam hibernálni és a jelenlegi rendszerem is frissebb mint a tiéd, de ettől függetlenül, ez talán nálad is beválhat.
Én mindig szoktam készíteni rendszer visszaállítási pontot a Thimeshifttel, mielőtt nekiállok NVIDIA meghajtót cserélgetni, ha besül a mutatvány, akár kintről is vissza tudjam állítani a rendszert.

megoldást nem tudok

Értékelés: 

0
Még nincs értékelve

Nem igazán használok Nvidia kártyákat, de:

A régebbi kártyák gyári driverét valóban csak 6.8-as kernel támogatja. Ez azt jelenti, hogy újabb Mint tiszta telepítéssel 6.14-es kernellel cumi. Viszont ha röptében frissíted, akkor marad a 6.8-as kernel. Ez direkt van így, Clem külön kiemelte / benne van a kiadási dokumentációban, akinek régebbi kártyája van, az előbb telepítsen 21-es Mint-et, és arra frissítsen az újabb rendszert.

Most azt javasolnám, nyugodtan engedd fel a 22.x Mint-et, majd telepítsd a Frissítéskezelővel a 6.14-es kernelt. A 6.8-as megmarad, és frissülni fog. Ha vissza kell lépni, akkor Grub-ból tudod indítani a 6.8-as kernelt, és el tudod távolítani a 6.14-et, ha nem jó.

 

Külső tároló

Értékelés: 

0
Még nincs értékelve

#1

Hello,

 

köszi - nem tudtam, hogy van külső tároló, ez mindenképp hasznos lehet. Közben talán sikerült megoldani a problémát, nemsokára leírom, hátha másnak is segítség lesz.

Egyelőre maradok a hivatalos driver-nél.

 

Köszi még egyszer.

megoldást nem tudok

Értékelés: 

0
Még nincs értékelve

#2

Köszi a segítséget.

> A régebbi kártyák gyári driverét valóban csak 6.8-as kernel támogatja. Ez azt jelenti, hogy újabb Mint tiszta telepítéssel 6.14-es kernellel cumi. 

Hátőőő... itt még 5.15.0 van. De igen, értem, mire utalsz.

> Most azt javasolnám, nyugodtan engedd fel a 22.x Mint-et, majd telepítsd a Frissítéskezelővel a 6.14-es kernelt. A 6.8-as megmarad, és frissülni fog. Ha vissza kell lépni, akkor Grub-ból tudod indítani a 6.8-as kernelt, és el tudod távolítani a 6.14-et, ha nem jó.

Mármint az 5.8-as kernelt tudom indítani :).

Egyelőre sikerült elhárítani a hibát, kicsit most használom még így, ha minden ok, akkor frissítek.

 

Köszi még egyszer.

Megoldva

Értékelés: 

5
Átlag: 5 (1 szavazat)

Közben a Gemini-t is faggattam, hogy mi lehet a hiba és hogy lehet elhárítani.

A logok elemzése során talált egy hibát:

NVRM: Xid 31

aminek a jelentése elvileg "GPU Memory Page Fault". Szerinte hibernáláskor a videokártya memóriája nem lett kiírva, és hibernálásból történő visszatéréskor ez okozott gondot.

A megoldás végül ez a három új kernel paraméter lett:

pcie_aspm=off pci=nommconf nouveau.modeset=0

A nouveau.modeset=0 nem kimondottan ehhez kel, az "csak" segít a driverek összeakadásának megelőzésében. Ill a pci=nommconf sem feltétlen ehhez kell, igazából csak a legelső, ami szerinte megoldotta.

Köszi mindenkinek.

Három kérdés:

Értékelés: 

0
Még nincs értékelve

Három kérdés:
1) Megfelelő méretű swap lemezterület be van állítva a rendszernek?
2) Grub-ban hozzá van adva ennek az uuid-je a GRUB_CMDLINE_LINUX_DEFAULT sorhoz?
Például így:
GRUB_CMDLINE_LINUX_DEFAULT="quiet splash resume=UUID=33a22b26-8ea4-438f-bd46-c590ef370f0f"
3) sudo update-grub és sudo update-initramfs -u megvoltak?

Jelenleg 22.3-as Mint (tiszta telepítés volt) alatt az 580-as drivert használom egy 1050Ti kártyával, 6.17-es kernellel és minden flottul működik (hibernálás is!).

22.3-as beállítása ez alapján történt:
https://automatestack.dev/enable-hibernate-mode-on-ubuntu-25-04-plucky-p...

Szerinte hibernáláskor a videokártya memóriája nem lett kiírva, és hibernálásból történő visszatéréskor ez okozott gondot.

...mert nem volt hová. A swap tehát vagy nincs, vagy nincs hozzáadva a grub-hoz. Szerintem.

Három kérdés:

Értékelés: 

0
Még nincs értékelve

#6

Köszi,

> 1) Megfelelő méretű swap lemezterület be van állítva a rendszernek?

Természetesen. Ahogy írtam, 5 éve teljesen fagyásmentesen megy a rendszer. Egyébként hogy számszerűsítsük: 16G RAM van a gépben, és 32G a SWAP.

> 2) Grub-ban hozzá van adva ennek az uuid-je a GRUB_CMDLINE_LINUX_DEFAULT sorhoz?

Természetesen. Ahogy írtam, 5 éven keresztül szinte minden nap hibernáltam, majd másnap abból ébredt a gép.

> 3) sudo update-grub és sudo update-initramfs -u megvoltak?

Természetesen.

> Jelenleg 22.3-as Mint (tiszta telepítés volt) alatt az 580-as drivert használom egy 1050Ti kártyával, 6.17-es kernellel és minden flottul működik (hibernálás is!).

Értem, de itt sajnos 21.3-as Mint van, és bár 19.X-ről indultam, eddig minden frissítés után stabil maradt a rendszer, de most HW váltás volt.

 

 

 

Megoldva

Értékelés: 

0
Még nincs értékelve

#5

Sajnos megint előjött a fagyás.

Érdekes, hogy munka közben egy webrádiót hallgattam, és a stream ment tovább, viszont semmire nem reagált a gép, konzolra (Alt+Ctrl+F3 pl) sem reagált.

A journalctl ezt mutatja:

# journalctl -b -1 -e | grep -i xid

febr 09 08:50:30 basil kernel: NVRM: Xid (PCI:0000:01:00): 32, pid=177, name=systemd-udevd, Channel ID 00000000 intr 00008000

(Tegnap Xid 31 volt a hibakód, most 32...)

Egyéb ötlet?

kami911 képe

Érdekes probléma, amit kernel

Értékelés: 

0
Még nincs értékelve

Érdekes probléma, amit kernel szinten beállítottál, az jó,  máshol is olvastam. Mi lenne ha későbbi nvidia illesztőprogramot próbálnál ki? Akár az 580-as is megfelelő lehet, ahogy néztem az támogatja a 5.x kerneleket is. Az újabb (590) főverziók már nem támogatják a GTX 10xx-es kárytákat. Lehet esetleg újabb kernelt is érdemes lenne próbálni,  ha csak nem direkt vagy ennél a régivel. 

nvidia-smi -q nem ad esetleg további információt a hibáról?

Amit lehet még esetleg:
– BIOS frissítés

– IOMMU kikapcsolása kernelparaméterrel vagy BIOS-ból
– BIOS-ban „PCIe Gen3 fix” beállítás automata helyett

 

https://docs.nvidia.com/deploy/xid-errors/analyzing-xid-catalog.html

https://docs.nvidia.com/deploy/xid-errors/working-with-xid-errors.html

Érdekes probléma, amit kernel

Értékelés: 

0
Még nincs értékelve

#9

> Mi lenne ha későbbi nvidia illesztőprogramot próbálnál ki? Akár az 580-as is megfelelő lehet, ahogy néztem az támogatja a 5.x kerneleket is.

Igazából ez volt a topic nyitásának a lényege, hogy kinek milyen tapasztalata van, érdemes-e másik modullal megpróbálni.

Tegnap jött kernel frissítés, így este ismét leállítottam a gépet, reggel clean boot volt. Kipróbáltam a hibernálást, de ismét volt egy xid hiba:

febr 10 08:27:05 basil kernel: NVRM: Xid (PCI:0000:01:00): 31, pid=179, name=systemd-udevd, Ch 00000000, intr 10000000. MMU Fault: ENGINE HOST6 HUBCLIENT_HOST faulted @ 0x20_646e7000. Fault is of type FAULT_PDE ACCESS_TYPE_READ

szóval még hangoltam (most bekerült az nvidia.NVreg_EnableMSI=1).

Nem tudom, hogy a 21.3-as Minthez van-e újabb kernel az 5.15-nél (biztos van külső tároló), a tervezett frissítés valszeg meghozná azt is.

BIOS-t nem nagyon akarok frissíteni - ill. relatíve régi az alaplap, nem tudom, van-e még hozzá frissítés (Gigabit Z270).

> – IOMMU kikapcsolása kernelparaméterrel vagy BIOS-ból
> – BIOS-ban „PCIe Gen3 fix” beállítás automata helyett

Az IOMMU most lazy mode, egyelőre nem piszkálom, holnap reggel meglátom, van-e még Xid hiba a boot-kor.

A PCIe most 8GT/s-en van az lspci szerint, ez elvileg Gen3, de nem biztos, hogy fix, lehet, hogy auto. Most nem akarom piszkálni, de a köv. fagyásnál (vagy hibernálás utáni Xid hiba esetén) megnézem.

Köszi mindent.