Ei toiminnassa

Se rupes syömään ihan hetskuna muistia niin mä tapoin sen. Seuraavalla kertaa sille vois virittää TimescaleDB:n tmv. longterm storagen, josko se ei sillon kiukuttelis.


Traconin tietojärjestelmien monitorointiratkaisu perustuu Prometheus-järjestelmään. Useimmat järjestelmän komponenteista pyörivät Monokkelilla, joka on valvonta- ja hallintatyökaluille tarkoitettu palvelin.

  

Käyttäjätunnus admin. Salasana löytyy kurikka:/root/passut-kansiosta (tai kysy Japsulta).

Grafana

Grafana (kotisivut, github) on ylläpitäjän ensisijainen käyttöliittymä Prometheukseen päin. Se tarjoaa kivoja, värikkäitä dashboardeja.

Konffaus Ansiblella (rooli prometheus). Pyörii Monokkelilla. Dockeroitu.

Prometheus

Prometheus kerää metriikoita erilaisilta exportereilta ja tallentaa niistä aikasarjat. Prometheuksen graafisesta käyttöliittymästä käsin voi lähinnä tarkastella Prometheuksen itsensä konfiguraatiota. Sieltä voi myös katsella käppyröitä, mutta Grafana on siihen parempi työkalu.

Konffaus Ansiblella (rooli prometheus). Pyörii Monokkelilla. Dockeroitu.

Yhden instanssin kaikkien aikasarjojen poistaminen
monokkeli$ curl -X DELETE -g 'http://localhost:8010/api/v1/series?match[]={instance="qb3.tracon.fi:9100"}'


Alertmanager

Alertmanagerin graafisesta käyttöliittymästä käsin näkee tämänhetkiset hälytykset. Niitä voi myös hiljentää.

Hälytykset tulevat tällä hetkellä Slackiin tekniikka-kanavalle. Sähköpostihälytykset ei toimi vielä.

Konffaus Ansiblella (rooli prometheus). Pyörii Monokkelilla. Dockeroitu.

Node Exporter

Node Exporter kerää virtuaalipalvelimista perustietoja, kuten CPU:n, muistin ja levytilan käyttöastetta.

Node Exporter on konffattu Ansiblella (rooli node-exporter). Node Exporter pyörii jokaisella palvelimella. Se ei ole kovin tyytyväinen elämäänsä Dockerin sisällä, joten se asuu Dockerin ulkopuolella.

Django-sovellukset

Django-sovellukset on tarkoitus instrumentoida tarjoamaan metriikoita suoraan sovelluksesta käsin. Tähän on kuitenkin hyvä pattern vielä hakusessa ja virittäminen on kesken. Suurimpana ongelmana on se, että django-prometheus kerää metriikoita vain prosessikohtaisesti, ei yhdistä niitä useamman prosessin yli. Tällöin metriikat pitäisi kerätä erikseen joka prosessilta. Tähän on olemassa keino, mutta sitä pitäisi vielä kokeilla.

Kompassi

Toistaiseksi se raportoi ihan puuta heinää, koska metriikkakyselyt ohjautuvat satunnaiselle worker-prosessille.

  • No labels